1 סטודנטים יקרים לפניכם ספר תרגילים בקורס הסקה סטטיסטית. הספר הוא חלק מקורס חדשני וראשון מסוגו בארץ בנושא זה, המועבר ברשת האינטרנט.On-line הקורס באתר כולל פתרונות מלאים לספר התרגילים, וכן את התיאוריה הרלוונטית לכל נושא ונושא. הקורס כולו מוגש בסרטוני וידאו המלווים בהסבר קולי, כך שאתם רואים את התהליכים בצורה מובנית, שיטתית ופשוטה, ממש כפי שנעשה בשיעור פרטי, לדוגמה לחצו כאן. את הקורס בנה מר ברק קנדל, מרצה מבוקש במוסדות אקדמיים שונים ובעל ניסיון עתיר בהוראת המקצוע. אז אם אתם עסוקים מידי בעבודה, סובלים מלקויות למידה, רוצים להצטיין או פשוט אוהבים ללמוד בשקט בבית, אנחנו מזמינים אתכם לחוויית לימודים יוצאת דופן וחדשה לחלוטין, היכנסו עכשיו לאתר.www.gool.co.il אנו מאחלים לכם הצלחה מלאה בבחינות צוות האתר GooL זה ב ול. ג ול בשבילך!
תוכן פרק - 1 הסקה סטטיסטית - הקדמה...4 פרק - התפלגות הדגימה...7 ממוצע המדגם ומשפט הגבול המרכזי...7 התפלגות סכום תצפיות המדגם התפלגות מספר ההצלחות במדגם ומשפט הגבול המרכזי...61 - הקרוב הנורמלי להתפלגות הבינומית...0 התפלגות פרופורציית ההצלחות במדגם...0 פרק - 3 אי שוויונים הסתברותיים...03 פרק - 4 מושגים בסיסיים באמידה...03 פרק - 5 רווח סמך לתוחלת )ממוצע האוכלוסייה(...03 רווח סמך קביעת גודל מדגם כששונות האוכלוסייה ידועה... 93 באמידת תוחלת עם שונות אוכלוסייה ידועה...61 רווח סמך לתוחלת )ממוצע האוכלוסייה( כששונות האוכלוסייה אינה ידועה...63 פרק - 6 רווח סמך לפרופורציה...55 קביעת גודל מדגם באמידת פרופורציה...5 פרק - 7 רווח סמך להפרש פרופורציות...63 פרק - 8 רווח סמך להפרש תוחלות ממדגמים בלתי תלויים...65 כששונויות האוכלוסייה כששונויות האוכלוסייה אינן ידועות ידועות...1 אך שוות...15 פרק - 3 רווח סמך לתוחלת ההפרש במדגם מזווג...73 פרק - 13 רווח סמך לשונות וסטיית תקן...70 פרק - 11 תרגול מסכם ברווחי סמך...78 פרק - 13 בדיקת השערות כללית...83 פרק - 10 בדיקת השערות על פרמטרים...83 הקדמה...53 טעויות בבדיקת השערות...30 פרק - 14 בדיקת השערות על תוחלת )ממוצע(...34 כאשר שונות האוכלוסיה סיכוי לטעויות ועוצמה כאשר שונות האוכלוסייה קביעת גודל מדגם מובהקות התוצאה בדיקת השערות מובהקות התוצאה הקשר בין ידועה...36 ידועה...33 כששונות האוכלוסיה ידועה...61 ( p-value ) בבדיקת השערות על תוחלת עם שונות ידועה...63 על תוחלת )ממוצע( כאשר שונות האוכלוסייה אינה ידועה...666 ( p-value ) בבדיקת השערות על תוחלת עם שונות אוכלוסייה לא ידועה...663 רווח סמך לבדיקת השערות על תוחלת...609 פרק - 15 בדיקת השערות על פרופורציה...136 התהליך...601 סיכוי לטעויות ועוצמה...69
3 קביעת גודל מדגם...69 מובהקות התוצאה...695 פרק - 16 בדיקת השערות על הפרש פרופורציות...143 פרק - 17 בדיקת השערות על הפרש תוחלות במדגמים בלתי תלויים...146 כשהשונויות של האוכלוסייה כששונויות האוכלוסיה לא ידועות ידועות...661 ומניחים שהן שוות...6 פרק - 18 בדיקת השערות על תוחלת ההפרשים במדגמים מזווגים )תלויים(...154 בדיקת השערות למדגמים מזווגים...66 פרק - 13 הקשר בין רווח סמך לבדיקת השערות על הפרש תוחלות...163 פרק 33- בדיקת השערות על שונויות... 164 בדיקת השערות על שונות האוכלוסייה כאשר התוחלת לא ידועה...616 בדיקת השערות על שתי שונויות...615 פרק 31 -שאלות מסכמות בבדיקת השערות על פרמטרים...174 שאלות מסכמות בבדיקת שאלות מסכמות בסגנון השערות על פרמטרים...676 רב ברירה ( אמריקאיות( על בדיקת השערות...656 פרק 33- מבחנים אפרמטריים...137 פרק - 30 מדדי קשר - מדד הקשר הלינארי )פירסון(...336 פרק - 34 מדדי קשר - רגרסיה ליניארית...314 פרק - 35 ניתוח שונות חד כיוונית...317
4 רקע: פרק - 1 הסקה סטטיסטית - הקדמה אוכלוסייה קבוצה שאליה מפנים שאלה מחקרית. למשל, חברת תרופות שמעוניינת לפתח תרופה למחלת הסוכרת מתעניינת באוכלוסיית חולי הסוכרת בעולם. מדגם חלק מתוך האוכלוסייה. למשל, אם נדגום באקראי 11 אנשים מתוך חולי הסוכרת אז זהו מדגם מתוך אוכלוסיית חולי הסוכרת. במקרים רבים אין אפשרות לחקור את כל האוכלוסייה כיוון שאין גישה לכולה, היא גדולה מידי, אנו מוגבלים בזמן ובאמצעים טכניים ולכן מבצעים מדגם במטרה לבצע הסקה סטטיסטית מהמדגם לאוכלוסייה. הדגימה בקורס תהייה דגימה מקרית סיכויי להיכלל במדגם. הכוונה לדגימה שבה לכל תצפית באוכלוסייה יש את אותו סטטיסטי )מדגם( פרמטר )אוכלוסייה( P X p סטטיסטי גודל המחושב על המדגם. פרמטר גודל המתאר את האוכלוסייה. הסימונים לפרמטר וסטטיסטי הם שונים למשל: ממוצע פרופורציה )שכיחות יחסית( פרמטר הוא גודל קבוע גם אם אנו לא יודעים אותו סטטיסטי הוא משתנה ממדגם למדגם ולכן יש לו התפלגות הנקראת התפלגות הדגימה.
5 דוגמה )פתרון בהקלטה(: 5% מאזרחי המדינה תומכים בהצעת החוק של חבר כנסת מסוים. הוחלט לדגום 511 אזרחים ומתוכם לבדוק מהו אחוז התומכים בהצעת החוק. א. ב. ג. ד. ה. ו. מי האוכלוסייה? מה המשתנה? מה הפרמטרים? מהו גודל המדגם? מהו הסטטיסטי שמתכננים להוציא מהמדגם? האם הפרמטר או הסטטיסטי הוא משתנה מקרי?
6 תרגילים : 1. מתוך כלל הסטודנטים במכללה שסיימו סטטיסטיקה א נדגמו שני סטודנטים. נתון שממוצע הציונים של כלל הסטודנטים היה 87 עם סטיית תקן של 1. א. מי האוכלוסייה? ב. מה המשתנה? ג. מהם הפרמטרים? ד. מהו גודל המדגם? 5. להלן התפלגות מספר מקלטי הטלוויזיה למשפחה בישוב "העוגן". נגדיר את x להיות מספר המקלטים של משפחה אקראית. מתכננים לדגום מאוכלוסיה זו 4 משפחות ולהתבונן בממוצע מספר מקלטי הטלוויזיה במדגם. מספר המשפחות 1 51 01 011 1 סך הכול N 1000 מספר מקלטים 1 1 5 0 4 א. מיהי האוכלוסייה ומהו המשתנה הנחקר? ב. מהו הסטטיסטי שיילקח מהמדגם ומה סימונו? 0. נתון כי 51% מהשכירים במדינה הם אקדמאיים. נבחרו באקראי 11 שכירים באותה אוכלוסייה ומתכננים לפרסם את מספר האקדמאיים שנדגמו. א. מהי האוכלוסייה? ב. מה המשתנה באוכלוסייה? ג. מהם הפרמטרים? ד. מהו הסטטיסטי?
7 פרק - התפלגות הדגימה ממוצע המדגם ומשפט הגבול המרכזי רקע: בפרק זה נדון בהתפלגות של ממוצע המדגם : x n x i מכיוון שממדגם למדגם אנו יכולים לקבל ממוצע מדגם שונה, אזי ממוצע המדגם הוא משתנה מקרי ויש לו התפלגות. גדלים המתארים התפלגות כלשהי או אוכלוסייה כלשהי נקראים פרמטרים. להלן רשימה של פרמטרים החשובים לפרק זה: ממוצע האוכלוסייה נסמן ב ( נקרא גם תוחלת (. שונות אוכלוסייה נסמן ב-. סטיית תקן של אוכלוסייה:. א. תכונות התפלגות ממוצע כל ממוצעי המדגם האפשריים שווה לממוצע האוכלוסייה: Ex ( ) x שונות כל ממוצעי המדגם האפשריים שווה לשונות האוכלוסייה מחולק ב- n. תכונה זו נכונה רק במדגם מקרי: V( x) x n יש יחס הפוך בין גודל המדגם לבין שונות ממוצעי המדגם. אם נוציא שורש לשונות נקבל סטיית תקן של ממוצע המדגם שנקראת גם טעות תקן: ( x) n n דוגמה: )פתרון בהקלטה( השכר הממוצע במשק הינו 0111 עם סטיית תקן של 4111. דגמו באקראי 5 עובדים. א. מי אוכלוסיית המחקר? מהו המשתנה הנחקר? ב. מהם הפרמטרים של האוכלוסייה? ג. מה התוחלת ומהי סטית התקן של ממוצע המדגם?
8 ב. דגימה מהתפלגות נורמאלית אם נדגום מתוך אוכלוסייה שהמשתנה בה מתפלג נורמאלית עם ממוצע ושונות המדגם גם יתפלג נורמאלית: ממוצע x ~ N(, ) n x Z x n דוגמה: )פתרון בהקלטה( משקל תינוק ביום היוולדו מתפלג נורמאלית עם ממוצע 0411 גרם וסטיית תקן של 411 גרם. מה ההסתברות שבמדגם של 4 תינוקות אקראיים בעת הולדתם המשקל הממוצע של התינוקות יהיה מתחת ל- 0. ק"ג? ג. משפט הגבול המרכזי אם אוכלוסייה מתפלגת כלשהו עם ממוצע ושונות ממוצע המדגם מתפלג בקירוב נורמאלית. x ~ N(, ) n אזי עבור מדגם מספיק גדול ( 30 ) n דוגמה: )פתרון בהקלטה( משקל חפיסת שוקולד בקו ייצור מתפלג עם ממוצע 111 גרם וסטיית תקן של 4 גרם. דגמו מקו הייצור 03 חפיסות שוקולד אקראיות. מה ההסתברות שהמשקל הממוצע של חפיסות השוקולד שנדגמו יהיה מתחת ל 115 גרם?
9 תרגילים : מתוך כלל הסטודנטים במכללה שסיימו סטטיסטיקה א נדגמו שני סטודנטים. נתון שממוצע הציונים של כלל הסטודנטים היה 87 עם סטיית תקן של 1. א. מי האוכלוסייה? ב. מה המשתנה? ג. מהם הפרמטרים? ד. מהו גודל המדגם? ה. מהו תוחלת ממוצע המדגם? ו. מהי טעות התקן?.1 5. להלן התפלגות מספר מקלטי הטלוויזיה למשפחה בישוב מסוים: מספר המשפחות 11 511 011 0111 11 סך הכול N 10000 מספר מקלטים 0 1 3 4 נגדיר את x להיות מספר המקלטים של משפחה אקראית. א. בנו את פונקצית ההסתברות של x. ב. חשבו את התוחלת, השונות וסטיית התקן של x. ג. אם נדגום 4 משפחות מהישוב עם החזרה מה תהיה התוחלת, מהי השונות ומהי סטיית התקן של ממוצע המדגם? 0. אם נטיל קובייה פעמיים ונתבונן בממוצע התוצאות שיתקבלו, מה תהיה התוחלת ומה תהיה סטיית התקן של ממוצע זה?
11 4. משקל תינוק ביום היוולדו מתפלג נורמאלית עם ממוצע 0411 גרם וסטיית תקן של 411 גרם א. מה ההסתברות שתינוק אקראי בעת הלידה ישקול פחות מ- 0711 גרם? נתון כי ביום מסוים נולדו 4 תינוקות. ב. מה ההסתברות שהמשקל הממוצע שלהם יעלה על 4 ק"ג? ג. מה ההסתברות שהמשקל הממוצע של התינוקות יהיה מתחת ל- 5. ק"ג? ד. מה ההסתברות שהמשקל הממוצע של התינוקות יהיה רחוק מהתוחלת בלא יותר מ- 1 גרם? ה. הסבירו ללא חישוב כיצד התשובה לסעיף הקודם הייתה משתנה אם היה מדובר על יותר מ- 4 תינוקות?. הגובה של המתגייסים לצה"ל מתפלג נורמאלית עם תוחלת של 18 ס"מ וסטיית תקן של 11 ס"מ. ביום מסוים התגייסו 13 חיילים. א. מה ההסתברות שהגובה הממוצע שלהם יהיה לפחות 101 ס"מ? ב. מה ההסתברות שהגובה הממוצע שלהם יהיה בדיוק 171 ס"מ? ג. מה ההסתברות שהגובה הממוצע שלהם יסטה מתחולת הגבהים בפחות מ- ס"מ? ד. מהו הגובה שבהסתברות של 01% הגובה הממוצע של המדגם יהיה נמוך ממנו? 3. הזמן הממוצע שלוקח לאדם להגיע לעבודתו 01 דקות עם שונות של 13 דקות רבועות. האדם נוסע לעבודה במשך שבוע פעמים. לצורך פתרון הניחו שזמן הנסיעה לעבודה מתפלג נורמאלית. א. מה ההסתברות שבמשך שבוע משך הנסיעה הממוצע יהיה מעל 00 דקות? ב. מהו הזמן שבהסתברות של 01% ממוצע משך הנסיעה השבועי יהיה גבוה ממנו? ג. מה ההסתברות שממוצע משך הנסיעה השבועי יהיה מרוחק מ- 01 דקות בלפחות 5 דקות? ד. כיצד התשובה לסעיף הקודם הייתה משתנה אם האדם היה נוסע לעבודה 3 פעמים בשבוע? 8. נפח היין בבקבוק מתפלג נורמאלית עם תוחלת של 81 סמ"ק וסטיית תקן של 11 סמ"ק. א. בארגז 4 בקבוקי יין. מה ההסתברות שהנפח הממוצע של הבקבוקים בארגז יהיה בדיוק 8 סמ"ק? ב. בארגז 4 בקבוקי יין. מה ההסתברות שהנפח הממוצע של הבקבוקים בארגז יהיה יותר מ 8 סמ"ק? ג. בארגז 4 בקבוקי יין. מה ההסתברות שהנפח הממוצע של הבקבוקים בארגז יהיה לפחות 8 סמ"ק? ד. בקבוקיי היין שבארגז נמזגים לקערה עם קיבולת של שלושה ליטר. מה ההסתברות שהיין יגלוש מהקערה?
11 7. משתנה מתפלג נורמאלית עם תוחלת 71 וסטיית תקן. 4 א. מה ההסתברות שממוצע המדגם יסטה מתוחלתו בלא יותר מיחידה כאשר גודל המדגם הוא 0? ב. מה ההסתברות שממוצע המדגם יסטה מתוחלתו בלא יותר מיחידה שגודל המדגם הוא 13? ג. הסבר את ההבדל בתשובות של שני הסעיפים. 0. בקזינו ישנה רולטה. על הרולטה רשומים המס' הבאים כמוראה בשרטוט: אדם מסובב את הרולטה וזוכה בסכום הרשום על הרולטה. א. בנו את פונקצית ההסתברות של סכום הזכייה במשחק בודד. ב. מה התוחלת ומה השונות של סכום הזכייה? ג. אם האדם ישחק את המשחק פעמים מה התוחלת ומה השונות של ממוצע סכום הזכייה בחמשת המשחקים? ד. אם האדם משחק את המשחק 1 פעם מה ההסתברות שבסה"כ יזכה ב- 111 ומעלה? 11. לפי הערכות הלשכה המרכזית לסטטיסטיקה השכר הממוצע במשק הוא 7111 עם סטיית תקן של. 0111 מה ההסתברות שבמדגם מקרי של 111 עובדים השכר הממוצע יהיה יותר מ-? 711 11. מטילים קובייה 1 פעמים בכל פעם מתבוננים בתוצאה של הקובייה. מה ההסתברות שהממוצע של התוצאות יהיה לפחות 0.85 ב- 1 ההטלות? 15. אורך צינור שמפעל מייצר הינו עם ממוצע של 81 ס"מ וסטיית תקן של 11 ס"מ. א. נלקחו באקראי 111 מוטות, מה ההסתברות שממוצע אורך המוטות יהיה בין 37 ל 87 ס"מ? ב. יש לחבר 5 בניינים באמצעות מוטות. המרחק בין שני הבניינים הינו 8511 ס"מ. מה ההסתברות ש 111 המוטות יספיקו למלאכה? ג. מה צריך להיות גודל המדגם המינימאלי, כדי שבהסתברות של % ממוצע המדגם יהיה קטן מ- 30 ס"מ. העזר במשפט הגבול המרכזי. 10. נתון משתנה מקרי בדיד בעל פונקצית ההסתברות הבאה: 4 6 8 X ¼ ¼ ¼ ¼ P(X) מתוך התפלגות זו נלקח מדגם מקרי בגודל. 1 מה הסיכוי שממוצע המדגם יהיה קטן מ-?
1 _ X 14. נתון ש X דגמו תצפיות מאותה התפלגות והתבוננו בממוצע המדגם : (, ) N לכן ) PX ( יהיה : ( בחר בתשובה הנכונה ) _ א. 1 ב. 1. ג. 1 ד. לא ניתן לדעת. 1. נתון ש X מתפלג כלשהו עם תוחלת : ושונות. החליטו לבצע מדגם בגודל 511 מתוך ההפלגות הנתונה לפי משפט הגבול המרכזי מתקיים ש: )בחר בתשובה הנכונה ) X N(, ) 00 א. N(, ) 00 ב. _ X (, ) ג. N X N(, ) 00 ד. אזי : X n Xi i1 n.13 נתון ש ), N(. X אם נדגום n תצפיות מתוך ההתפלגות ונגדיר )בחר בתשובה הנכונה( א. ו- X יהיו משתנים מקריים. ב. יהיה משתנה מקרי ו X קבוע. ג. X יהיה משתנה מקרי ו קבוע. יהיו קבועים. ד. ו X
13 18. משקל חפיסת שוקולד בקו ייצור מתפלג עם ממוצע 111 גרם. החפיסות נארזות בקרטון המכיל 03 חפיסות שוקולד אקראיות. ההסתברות שהמשקל הממוצע של חפיסות השוקולד בקרטון יהיה מעל 00 גרם הוא 1.0005. א. מהי סטיית התקן של משקל חפיסת שוקולד בודדת? ב. מה הסיכוי שמתוך 4 קרטונים בדיוק קרטון אחד יהיה עם משקל ממוצע לחפיסה הנמוך מ- 111 גרם? 17. משתנה מקרי כלשהו מתפלג עם סטיית תקן של 51. מה הסיכוי שאם נדגום 111 תצפיות בלתי תלויות מאותה התפלגות אזי ממוצע המדגם יסטה מתוחלתו בפחות מ- 5? 10. מספר המכוניות הנכנסות לחניון "בציר " במשך היום מתפלג פואסונית עם קצב של מכונית אחת לדקה. שומר מסר נתונים על מספר המכוניות שנכנסות בכל שעה לגבי 41 שעות שאסף נתונים. מה ההסתברות שממוצע מספר המכוניות שנכנסו לחניון לשעה בשעות אלה יהיה לפחות 30? 51. הוכיחו שאם משתנה מתפלג כלשהו עם תוחלת ושונות ומבצעים מדגם בגודל n של תצפיות בלתי תלויות מהמשתנה, אזי מתקיימות התכונות הבאות לגבי ממוצע המדגם: Ex ( ) V( x) n
14 פתרונות: 4 0 5 1 1 X שאלה א. 1.1 1.0 1.0 1.5 1.1 P(x).05 0.9475 0.973.05 0.369 X X ב. ג. ( X ) 0.486 שאלה 3 3.5 X ( X ) 1.1 שאלה 4 1.7410 1.1110 1 1.1084 א. ב. ג. ד. שאלה 6 א. 1.143 ב. 58.81 ג. 1.5357 שאלה 7 1 1.178 1.178 1. א. ב. ג. ד.
15 שאלה 8 1.437 1.3753 א. ב. 01 1. 51 1.5 שאלה 9 א. 11 1.5 P(x) ב. התוחלת: 55. השונות: 37.8 ג. התוחלת: 55. השונות: 10.8 ד. 1.7008 שאלה 10 1.148 שאלה 11 1.1714 שאלה 1 א. 1.0885 ב. 1.1557 ג. 581 שאלה 14 התשובה ב שאלה 11 התשובה ד שאלה 16 התשובה ג שאלה 17 א. 5.450 ב. 1.5
16 רקע: התפלגות סכום תצפיות המדגם ומשפט הגבול המרכזי T n X i1 i כעת נדון בסטטיסטי המבטא את סכום התצפיות במדגם כאשר כל התצפיות נדגמו באקראי מאותה אוכלוסייה. כלומר, היו ושונותה - משתנים מקריים בלתי תלויים בעלי התפלגות זהה שתוחלתה X,..., 1 X n אזי: א. התוחלת והשונות של סכום התצפיות: E( T) n V ( T) n ב. דגימה מתוך התפלגות נורמלית: T N n n ~ (, ) T n Z n X אם ), ~ N( אזי ג. משפט הגבול המרכזי : EX ( ) V( X) אם x מתפלג כלשהו וידוע אזי עבור מדגם מספיק גדול 01( )לפחות T N n n ~ (, ) דוגמה: ( פתרון בהקלטה( בעיר מסוימת המשכורת הממוצעת של עובד הינה. 7111 עם סטיית תקן של. 5111 נדגמו 111 עובדים מהעיר שמפקידים את משכורותיהם לסניף בנק. א. מה התוחלת וסטיית התקן של סך המשכורות שיופקדו לסניף הבנק על ידי העובדים הללו? ב. מה ההסתברות שלסניף יופקד פחות מ- 871 אלף ע"י אותם עובדים? ( 1.178 )
17 תרגילים: המשקל באוכלוסייה מסוימת מתפלג נורמאלית עם תוחלת של 31 ק"ג וסטיית תקן של 11 ק"ג. א. מה הסיכוי שאדם אקראי מהאוכלוסייה ישקול מתחת ל- 3 ק"ג? ב. מה הסיכוי שהמשקל הממוצע של 4 אנשים אקראיים יהיה מתחת ל- 3 ק"ג? ג. מה הסיכוי שהמשקל הכולל של 4 אנשים אקראיים יהיה מתחת ל- 541 ק"ג?.1 נפח יין בבקבוק מתפלג נורמאלית עם תוחלת של 81 מ"ל וסטיית תקן של 51 מ"ל. אדם קנה מארז של 4 בקבוקי יין. א. מהי התוחלת ומהי סטיית התקן של נפח היין במארז? ב. את היין שבמארז האדם מזג לכלי שקיבולתו 0.1 ליטר. מה ההסתברות שהיין יגלוש מהכלי? ג. אם לא היה נתון שנפח היין מתפלג נורמאלית. האם התשובה לסעיף א הייתה משתנה? האם התשובה לסעיף ב הייתה משתנה?.5 בספר כלשהו 11 עמודים. קצב הקריאה הממוצע הוא עמוד אחד ב 4 דקות עם סטיית תקן של 1 דקות. א. מה ההסתברות לסיים את הפרק הראשון )41 עמודים( תוך שעתיים וחצי? ב. מהו האחוזון ה- 0 לזמן סיום קריאת הספר?.0 4 במגדל נבנו 41 יחידות דיור. כמו כן נבנו 10 מקומות חנייה לבניין. להלן פונקצית ההסתברות של מספר המכוניות ליחידת דיור: P X x x 1 1.1 5 1.5 0 1.0 1.5 1.1.4 נניח שמספר המכוניות ליחידת דיור בלתי תליות זו בזו ועם אותה פונקצית הסתברות לכל יחידת דיור ( אין צורך בתיקון רציפות(. א. מהי ההסתברות שיהיה מקום בחניון המגדל לכל מכוניות הבניין? ב. בהינתן ויש מקום במגדל לכל המכוניות, מה הסיכוי שבפועל מספר המכוניות נמוך מ-?101
18. בקזינו ישנה רולטה עליה מסומנים המספרים הבאים: אדם מסובב את הרולטה וזוכה בסכום הרשום על הרולטה. א. אם האדם משחק את המשחק 1 פעמים מה ההסתברות שבסך הכול יזכה בסכום של 111 שקלים ומעלה? ב. האדם מגיע בכל יום לקזינו ומשחק את המשחק 1 פעם עד אשר מגיע היום בו הוא יזכה ב- 111 שקלים ומעלה. מה התוחלת ומהי השונות של מספר הימים שיבלה בקזינו?
19 פתרונות: שאלה 1 א. 1.301 ב. 1.7410 ג. 1. שאלה א. תוחלת 0111 מ"ל וסטיית תקן 41 מ"ל ב. 1.1135. שאלה 4 א. 1.770 שאלה 1 א. 1.7008 ב. תוחלת : 1.111 שונות 1.1500
1 התפלגות מספר ההצלחות במדגם - הקרוב הנורמלי להתפלגות הבינומית רקע: תזכורת על התפלגות בינומית בפרק זה נדון על התפלגות מספר ההצלחות במדגם אקראי ( תצפיות בלתי תלויות זו בזו(. מספר ההצלחות במדגם נסמן ב Y. מחלקים כל תצפית במדגם להצלחה או כישלון. כעת מה שמשתנה מתצפית לתצפית הוא משתנה דיכוטומי ( משתנה שיש לו שני ערכים(. תצפית הצלחה כישלון. הסיכוי להצלחה יסומן עם הפרמטר p וכישלון יסומן ע"י הפרמטר q 1 p. מבצעים מדגם אקראי בגודל n p( y k) n k p k q nk Y ~ B( n, p) פונקציית ההסתברות של ההתפלגות הבינומית היא : E( y) np V( y) npq תוחלת : שונות:
1 קירוב נורמלי עבור התפלגות בינומית Y ~ B( n, p) אם לפנינו התפלגות בינומית : ומתקיים ש : np 5.1 n(1 p) 5.5 y ~ N( np, npq) Z y y np npq אז : תיקון רציפות: כאשר משתמשים בקירוב הנורמלי להתפלגות הבינומית יש לבצע תיקון רציפות. הסיבה שעוברים כאן מהתפלגות בדידה להתפלגות נורמלית שהיא התפלגות רציפה. על פי הכללים הבאים: 1 1 p( Y a) p( a Y a ) P( Y a) P( Y a 0.5) P( Y a) P( Y a 0.5).1.5.0
הערות: התנאים למעבר מבינומי לנורמלי הם נזילים, כלומר משתנים ממרצה אחד לשני. התנאי שהצגתי כאן הוא הפופולרי ביותר: np 5.1 n(1 p) 5.5 ישנם מרצים שנותנים את התנאי המחמיר הבא: np 10.1 n(1 p) 10.5. n 30 וישנם מרצים שפשוט התנאי שהם נותנים הוא : תאלצו לבדוק מהו התנאי שנתנו לכם בכיתה כדי לעבור מהתפלגות בינומית לנורמלית. הערה נוספת היא לגבי תיקון רציפות. ישנם מרצים שלא מחייבים לבצע תיקון רציפות שהמדגמים גדולים ( בדרך כלל מעל 111 תצפיות( אני בפתרונות שאציג תמיד אבצע תיקון רציפות במעבר מבינומי לנורמלי כיוון שכך הפתרון יהיה יותר מדויק ( בכל מקרה שהמדגמים גדולים העניין זניח(. דוגמה: )הפתרון בהקלטה ) נתון שבקרב אוכלוסיית הנוער 5% זקוקים למשקפיים. נדגמו באקראי 47 בני נוער. א. ב. מה הסיכוי שבדיוק 14 מתוכם יהיו זקוקים למשקפיים? מה הסיכוי שלכל היותר 10 מתוכם זקוקים למשקפיים?
3 תרגילים: 1. נתון ש- 51% מאוכלוסייה מסוימת אקדמאית. נבחרו באקראי 11 אנשים באותה אוכלוסייה. א.מה ההסתברות ששלושה מהם אקדמאים? ב. מה ההסתברות שלכל היותר אחד מהם אקדמאי? ג. מה התוחלת ומהי סטיית התקן של מספר האקדמאים במדגם? 5. במפעל 11% מהמוצרים פגומים. נלקחו 111 מוצרים באקראי מקו הייצור. א.מה ההסתברות שנדגמו לפחות 3 מוצרים פגומים? ב. מה ההסתברות שמספר המוצרים הפגומים יהיה לכל היותר 11 במדגם? ציוני פסיכומטרי בקרב הנרשמים למוסד מסוים מתפלגים נורמאלית עם ממוצע 11 וסטיית תקן 111. למוסד מסוים הוחלט לקבל אך ורק סטודנטים שקיבלנו מעל 311 בפסיכומטרי. 111 סטודנטים אקראיים נרשמו למוסד. מה ההסתברות שלפחות 51 יתקבלו?.0 מטילים מטבע 1 פעמים. א. מה ההסתברות לקבל לכל היותר 01 עצים? ב. מה ההסתברות לקבל 57 עצים לפי התפלגות הבינומית ולפי הקירוב הנורמאלי?.4 במטוס מקום ל- 411 נוסעים. נרשמו לטיסה 401 אנשים.)overbooking( מנתונים סטטיסטיים ידוע שהסיכוי שאדם שנרשם לטיסה אכן יגיע הוא 1.0. א. מה ההסתברות שלא יהיו מקומות ישיבה לכל האנשים שהגיעו לטיסה? ב. מה צריך להיות גודל המטוס כדי שבסיכוי שלפחות 0% המטוס יספיק לכמות הנרשמים?. מפעל לייצור ארטיקים טוען ש הסיכוי שארטיק שהוא מייצר יהיה פגום הוא. 1.11 מוכר הזמין 1111 ארטיקים מהמפעל. מה ההסתברות שהמוכר יקבל לפחות 071 ארטיקים תקינים אם טענת המפעל מוצדקת?.3 מהמר מטיל קובייה הוגנת 111 פעמים. בכל הטלה, אם מתקבל תוצאה זוגית בקובייה המהמר זוכה בשקל. אחרת, המהמר משלם שקל. המהמר הטיל את הקובייה 111 פעמים מה הסיכוי שהרווח של המהמר יהיה לכל היותר? 11.8
4 שאלה 1 א. 1.511 ב. 1.087 ג. התוחלת : 5, סטיית התקן : 1.5340 פתרונות: שאלה א. 1.0005 ב. 1.301 שאלה 3 1.1311 שאלה 4 א. 1.0413 שאלה 1 א. 1.11 שאלה 6 0.9996 שאלה 7 1.7340
5 התפלגות פרופורציית ההצלחות במדגם רקע: בפרק זה נדון על התפלגות הדגימה של פרופורציית המדגם. Y- מספר ההצלחות במדגם )למשל, מספר המובטלים במדגם( - פרופורציית ההצלחות במדגם ( למשל, שיעור המובטלים במדגם ) p y n למשל, n 00 Y 0 מספר המובטלים : p פרופורציית המובטלים במדגם 0 0.1 00 נסמן ב- p את שיעור ההצלחה באוכלוסייה וב- q את שיעור הכישלונות באוכלוסייה. נבצע מדגם מקרי ( הנחה שהתצפיות בלתי תלויות זו בזו( ונתבונן בהתפלגות של פרופורציית המדגם. התוחלת, השונות וסטיית התקן של פרופורציית המדגם: E( Pˆ ) V( Pˆ ) ( pˆ ) p pq n pq n משפט הגבול המרכזי עבור הפרופורציה המדגמית : pq p ~ N( p, ) n אם np 5& nq 5 אזי Z p p p pq n
6 הערות: התנאים לקרוב הנורמאלי הם נזילים, כלומר משתנים ממרצה אחד לשני. התנאי שהצגתי כאן הוא הפופולרי ביותר: np 5.1 n(1 p) 5.5 ישנם מרצים שנותנים את התנאי המחמיר הבא: np 10.1 n(1 p) 10.5. n 30 וישנם מרצים המשתמשים בתנאי : תאלצו לבדוק מהו התנאי שנתנו לכם בכיתה כדי לעבור לנורמלית. כיוון שפרופורציה אינה חייבת להיות מספר שלם בהכרח לא נהוג לבצע כאן תיקון רציפות. דוגמה : )פתרון בהקלטה ) לפי נתוני משרד החינוך בעיר ירושלים ל- 31% מתלמידי התיכון זכאים לתעודת בגרות. נדגמו 511 תלמידי תיכון. א. מה ההסתברות שהשכיחות היחסית (p ( של הזכאים לבגרות במדגם תעלה על 31%? ב. מה ההסתברות שפרופורציית הזכאים לבגרות במדגם תעלה על 81%?
7 תרגילים: במדינה מסוימת 11% מכלל האוכלוסייה הינם מובטלים. נדגמו באקראי 141 אנשים מהמדינה. א. מה התוחלת ומהי השונות של פרופורציות המובטלים שנדגמו? ב. מה ההסתברות שבמדגם לפחות 11% יהיו מובטלים? ג. מה ההסתברות שלכל היותר 0% מהמדגם יהיו מובטלים?.1 נניח כי 01% מהאוכלוסייה תומכים בהצעת חוק מסוימת. אם נדגום מהאוכלוסייה 511 איש. חשבו את ההסתברויות הבאות: א. לפחות 0% יתמכו בהצעת החוק במדגם. ב. לכל היותר 5% יתמכו בהצעת החוק במדגם. ג. יותר מ 58% יתמכו בהצעת החוק במדגם..5 לפי נתוני משרד התקשורת 41% מהאוכלוסייה מחזיקים בטלפון נייד מסוג "סמארטפון". נדגמו 411 אנשים מהאוכלוסייה. א. מה ההסתברות שבמדגם לכל היותר ל 41% יש סמארטפון? ב. מה ההסתברות שבמדגם לרוב יש סמאטרפון? ג. מה ההסתברות שפרופורציית בעלי הסמרטפון במדגם תסטה מהפרופורציה באוכלוסייה בלא יותר מ- 4%? ד. כיצד התשובה לסעיף הקודם הייתה משתנה אם הינו מגדילים את גודל המדגם?.0 נתון כי 71% מבתי האב מחוברים לאינטרנט. נדגמו 411 בתי אב אקראיים. א. מה ההסתברות שלפחות 041 מהם מחוברים לאינטרנט? ב. מה ההסתברות שפרופורציית המחוברים לאינטרנט במדגם תסטה מהפרופורציה האמתית ביותר מ- 4%? ג. כמה בתי אב יש לדגום כדי שהסטייה בין הפרופורציה המדגמית לפרופורציה האמתית לא תעלה על 0% בהסתברות של 01%? ד. מהו העשירון התחתון של התפלגות פרופורציית המדגם?.4 נתון שציוני פסיכומטרי מתפלגים נורמלית עם תוחלת 11 וסטיית תקן 111. ל"מועדון ה- 811" נכללים נבחנים שמקבלים ציון מעל 811 בפסיכומטרי. מה הסיכוי שבמועד בו נבחנו 5111 נבחנים אקראיים יהיו לפחות 0% המשתייכים למועדון?.
8. Pˆ X n X נתון ש p) B( n, נגדיר את המשתנה הבא :.3 א. הוכיחו ש: E( Pˆ ) p V( Pˆ ) P(1 P) n ˆP )V להיות במקסימום? ) מה ב. p המביא את
9 פתרונות: שאלה 1 א. התוחלת: 1.1, השונות: 1.11134 ב. 1. ג. 1.0443 שאלה א. 1.1317 ב. 1.1317 ג. 1.7507 שאלה 3 א. 1. ב. 1 ג. 1.7037 ד. גדלה שאלה 4 א. 1.1135 ב. 1.143
31 אי שוויון צ'ביצ'ב פרק - 3 אי שוויונים הסתברותיים מצא חסמים להסתברויות הבאות עבור משתנה מקרי רציף בעל תוחלת 7 וסטית תקן. 0 א. p( x 14).1 p( x 8 9) ב. מתוך קו יצור של רכיבים שאורכם הממוצע הנו 11 ס"מ ושונותם 0 סמ"ר. יש לקחת מדגם. מהו גודל המדגם שיבטיח שבהסתברות של 1.0 לפחות ימצא ממוצע המדגם בין 0 ל 11 - ס"מ?.5 אחוז התומכים במפלגה מסוימת הנו. 41% נלקח מדגם מקרי בגודל. 511 תן חסם תחתון לכך שאחוז התומכים במדגם יהיה בין 0% ל 4%..0 מספר המטוסים המגיעים לנמל תעופה ב 51 דקות מתפלג התפלגות פואסונית עם תוחלת של. 111 העזר באי שוויון צ'ביצ'ב כדי למצוא גבול תחתון להסתברות שמספר המטוסים המגיעים בתקופה בת 51 דקות נתונה תהיה בין 71 ל 151. בוחרים מספר n ספרתי באופן מקרי. )הספרה ראשונה יכולה להיות 1( א. עבור : n 10 הערך את ההסתברות שממוצע הספרות במספר יסטה מתוחלתו בלפחות 1. ב. מה אורך המספר המינימלי )n( שיבטיח שבהסתברות של 0%, ממוצע הספרות יסטה מתוחלתו בפחות מ- 1.8?לפי אי-שוויון צ'בישב..4. בעיר מסוימת ל % מהמשפחות אין מכונית, ל- 51% יש מכונית אחת,ל- 0% יש שתי מכוניות,ל- 01% שלוש מכוניות וליתר ארבע מכוניות. נניח שמספר המשפחות ביישוב הוא גדול מאד. הערך את ההסתברות שמספר המכוניות הכולל בעשר משפחות יהיה לפחות 18 ולכל היותר ל- 58..3
31 תשובות סופיות - אי שוויונים הסתברותיים אי שוויון צ'ביצ'ב שאלה 1 א. בין 0/4 ל- 1 ב. בין 1 ל- 1/0 שאלה לפחות 01 שאלה 4 1.8 שאלה 6 1.813 שאלה 3 1.5 שאלה 1 א. 1.75 ב. 504
3 רקע: פרק - 4 מושגים בסיסיים באמידה כזכור מהמפגש הקודם פרמטר הוא גודל המתאר את האוכלוסייה או התפלגות מסוימת. כמו ממוצע הגבהים בקרב מתגייסים לצה"ל-. כמו פרופורציית התומכים בממשלה בקרב אזרחי המדינה - p. בדרך כלל הפרמטרים הם גדלים שאינם ידועים באמת, ולכן מבצעים מדגמים במטרה לאמוד אותם. אין אפשרות לחשב אותם הניסיון הוא בלהעריך כמה הם שווים ככל שניתן. ˆ הוא סטטיסטי המחושב על המדגם ˆ. ואומד ב- θ נסמן באופן כללי פרמטר באות ובאמצעותו נאמוד את θ. ˆ שגיאת אמידה: - ההפרש בין האומד לאמת)הפרמטר(. דוגמה: )פתרון בהקלטה( בכנסת ה- 10 קיבלה מפלגת העבודה 1 מנדטים. בערוץ 11 ברגע סגירת הקלפיות העריכו את מספר המנדטים של המפלגה להיות 18 מנדטים וזאת על סמך תוצאות מדגם של הערוץ. מה הפרמטר בדוגמה זו? מהי טעות האמידה של ערוץ 11? : θ תהיה שווה ל ˆ אם התוחלת של θ יהיה אומד חסר הטיה ל ˆ טעות התקן של אומד היא סטיית התקן שלו, כלומר : E( ˆ ) ( ˆ) SE.
33 להלן פרמטרים מרכזיים והאומדים שלהם: ממוצע האוכלוסייה: x x n האומד הנקודתי שלו יהיה : ממוצע המדגם לכן. הינו אומר חסר הטיה ל x E(x) ( x) SE n כמו כן טעות תקן: פרופורציה באוכלוסייה: p pˆ y n האומד הנקודתי שלו יהיה: פרופורציה במדגם:. p לכן ˆp הינו אומר חסר הטיה ל E( pˆ) p ( Pˆ ) p(1 p) n כמו כן טעות התקן: שונות האוכלוסייה: ( x ) i x S n 1 האומד הנקודתי שלו יהיה :. ולכן S הינו אומד חסר הטיה ל ES ( ) ( x ) i x x nx S n1 n1 i הערה: אומד הוא הנוסחה הכללית לאמידת הפרמטר ואומדן הוא הערך הספציפי שהתקבל במדגם מסוים.
34 דוגמה: ( פתרון בהקלטה( נדגמו 11 משפחות בתל אביב ונבדק עבור כל משפחה מספר הילדים שלה. להלן התוצאות שהתקבלו: 5,1,0,5,1,4,,5,1,0 אמדו באמצעות אומדים חסרי הטיה את הפרמטרים הבאים: ממוצע מספר הילדים למשפחה בתל אביב. שונות מספר הילדים למשפחה בתל אביב..1.5 0. פרופורציית המשפחות בנות שני ילדים.
35 תרגילים: 1. מתוך 11 טירונים נמצאו 151 בעלי שברי הליכה. נתון שהסיכוי שטירון יהיה עם שבר הליכה הוא 1.5. א. מהי האוכלוסייה המוצגת בשאלה? מהם הפרמטרים שלה? ב. מהי טעות התקן של האומד כשהמדגם בגודל 11? ג. מהו האומדן לפרמטר? ד. מהי טעות האמידה? 5. לפי נתוני היצרן מקרר צורך בממוצע 5411 וואט לשעה עם סטיית תקן של 11 וואט לשעה. במדגם של 5 מקררים של היצרן התקבל ממוצע של 5045 וואט לשעה. א.מהי האוכלוסייה המוצגת בשאלה? מהם הפרמטרים שלה? ב.מהי טעות התקן של האומד? ג. מהו האומדן לפרמטר? ד. מהי טעות האמידה? 0. נדגמו עשרה מתגייסים לצה"ל. גובהם נמדד בס"מ. להלן התוצאות שהתקבלו: 188,137,178,188,171,181,105,174,137 ו- 18. א. ב. ג. מצא אומדן חסר הטיה לגובה הממוצע של מתגייסי צה"ל. מצא אומדן חסר הטיה לשונות הגבהים של מתגייסי צה"ל. מצא אומדן חסר הטיה לפרופורציות המתגייסים בגובה של לפחות 171 ס"מ.. 0 i1 X i 0 i1 i 4. נדגמו 51 שכירים באקראי. עבור כל שכיר נמדד השכר באלפי שקלים. להלן התוצאות שהתקבלו: 150. X 16 א. אמדו את השכר הממוצע של השכירים במשק. ב. אמדו את סטיית התקן של שכר השכירים במשק.
36. במטרה לאמוד את ממוצע האוכלוסייה. דגמו תצפיות בלתי תלויות מהאוכלוסייה וחישבו את הממוצע שלהם. מהי טעות התקן? א. סטיית התקן של האוכלוסייה. ב. סטיית התקן של ממוצע האוכלוסייה. ג. סטיית התקן של המדגם. ד. סטיית התקן של ממוצע המדגם. 3. משקל הממוצע של אוכלוסייה מסוימת הוא 8 ק"ג עם שונות של. 5 אם יבחרו כל המדגמים האפשריים בגודל 11 מאוכלוסייה זו סטיית התקן של ממוצעי המדגמים תהייה: א. 0 ב. 5. ג. 1.71 ד.אין מספיק נתונים לדעת. במדגם מקרי, מתי סכום ריבועי הסטיות מהממוצע, א. כאשר n קטן. ב. כאשר תצפיות המדגם אינן בלתי תלויות. ג. כאשר האוכלוסייה אינה מתפלגת נורמאלית., מחולק ב- ד. כאשר מעוניינים באומד חסר הטיה לשונות האוכלוסייה ממנה הוצא המדגם. ה. כאשר מעוניינים לחשב את שונות התפלגות הדגימה של ממוצע המדגם.? n1 n i1 (x x) i.8 X1, X,..., X16 מדגם מקרי מתוך אוכלוסייה בעלת ממוצע לא ידוע ושונות.7. 64 טעות התקן של האומד ל- היא: א. 13 ב. 7 ג. 4 ד. 5
37 0. מהו אומד חסר הטיה? א. אומד שערכו שווה לממוצע התפלגות הדגימה שלו. ב. אומד שערכו שווה לערך הפרמטר באוכלוסייה. ג. אומד שממוצע התפלגות הדגימה שלו שווה לערך הפרמטר באוכלוסייה. ד. אומד שהסיכוי שערכו יהיה גבוה מערך הפרמטר באוכלוסייה שווה לסיכוי שיהיה נמוך ממנו.
38 פתרונות: שאלה 3 א. 188.0 ב. 34.1 ג. 1.4 שאלה 4 א. 7.1 ב. 0.13 שאלה 1 התשובה היא ד. שאלה 6 התשובה היא ג. שאלה 7 התשובה היא ד. שאלה 8 התשובה היא ד. שאלה 9 התשובה היא ג.
39 רקע: פרק - רווח סמך לתוחלת )ממוצע האוכלוסייה( רווח סמך כששונות האוכלוסייה ידועה ממוצע המדגם הוא אומד לממוצע האוכלוסייה, אך לא באמת ניתן להבין ממנו על גודלו של ממוצע האוכלוסייה. ההסתברות שממוצע המדגם יהיה בדיוק כמו הממוצע האמתי הוא אפסי. מה שנהוג לעשות כדי לאמוד את ממוצע האוכלוסייה זה לבנות רווח סמך. נבנה מרווח בטחון שהסיכוי שהפרמטר ייכלל בתוכו הוא α-1. α-1 : נקרא רמת בטחון או רמת סמך. כך ש: P( A B) 1 A- גבול התחתון של רווח הסמך B- הגבול העליון של רווח הסמך L B A - אורך רווח הסמך דוגמה : )פתרון בהקלטה( חוקר דגם 5 חיילים שנבחנו במבחן הפסיכומטרי. הוא בנה רווח סמך לממוצע הציונים במבחן הפסיכומטרי בקרב אוכלוסיית החיילים וקיבל בין 11 ל- 01. רווח הסמך נבנה ברמת סמך של.0% מהי אוכלוסיית המחקר? מה המשתנה באוכלוסייה? מה הפרמטר שהחוקר רצה לאמוד? מהו רווח הסמך? מה אורך רווח הסמך? מהי רמת הביטחון של רווח הסמך?
41 בפרק זה נרצה לבנות רווח סמך לתוחלת ( ) במקרה ש )שונות האוכלוסייה( ידועה הפרמטר שנרצה לאמוד: האומד נקודתי: x 1 התנאים לבניית רווח הסמך: n או 30 X ~ N 5 )שונות האוכלוסייה( ידועה הנוסחה לרווח הסמך: x Z 1 n דוגמה : )פתרון בהקלטה ) על פי נתוני היצרן אורך חיי סוללה מתפלג נורמאלית עם סטיית תקן של 1 שעה. מעוניינים לאמוד את תוחלת חיי סוללה. נדגמו באקראי 4 סוללות, אורך החיים הממוצע שהתקבל הוא 10. שעות. בנו רווח סמך ברמת סמך של 0% לתוחלת אורך חיי סוללה.
41 שגיאת האמידה המקסימלית: Z 1 n -נותן את שגיאת האמידה המקסימלית, דבר שנקרא גם טעות סטטיסטית, טעות דגימה. דוגמה : )פתרון בהקלטה ) בהמשך לשאלה עם הסוללות. מה ניתן להגיד בביטחון של 0% על שגיאת האמידה? קשרים מתמטיים ברווח הסמך:. L אורך רווח הסמך הוא פעמיים שגיאת האמידה המקסימלית : X A B ממוצע המדגם נופל תמיד באמצע רווח הסמך: ככל שמספר התצפיות (n) גבוה יותר, כך יש יותר אינפורמציה ולכן האומד יותר מדויק, ולכן נקבל רווח סמך יותר קצר. ככל שרמת הביטחון (1 ) גבוהה יותר כך z 1 יותר גבוה, ורווח הסמך יותר ארוך.
4 תרגילים : חוקר התעניין לאמוד את השכר הממוצע במשק. על סמך מדגם הוא קבע שבביטחון של -0% כי השכר הממוצע במשק נע בין 0511 ל- 0711. א. מי האוכלוסייה במחקר? ב. מה המשתנה הנחקר? ג. מה הפרמטר שאותו רוצים לאמוד? ד. מה רווח הסמך לפרמטר? ה. מהי רמת הסמך לפרמטר? ו. מה אורך רווח הסמך? ז. מה הסיכוי שטעות הדגימה תעלה על? 011.1 מעוניינים לאמוד את התפוקה היומית הממוצעת של מפעל מסוים ברמת סמך של 0%. במדגם אקראי של 111 ימים התקבלה תפוקה ממוצעת 401 מוצרים ביום. לצורך פתרון הנח שסטיית התקן האמתית ידועה ושווה 11 מוצרים ביום. בנה את רווח הסמך..5 מעוניינים לאמוד את ממוצע אורך החיים של מכשיר. מנתוני היצרן ידוע שאורך החיים מתפלג נורמאלית עם סטיית תקן של 51 שעות. נדגמו 5 מכשירים ונמצא כי ממוצע אורך החיים שלהם היה 501 שעות. א. בנו רווח סמך ברמת סמך של 01% לאורך החיים הממוצע של מכשיר. ב. בנו רווח סמך ברמת סמך של 0% לאורך החיים הממוצע של מכשיר. ג. הסבר כיצד ומדוע השתנה רווח הסמך..0 דגמו 511 עובדים מהמשק הישראלי. השכר הממוצע שלהם היה. 0811 נניח שסטיית התקן של השכר במשק היא. 0111 א. בנו רווח סמך ברמת סמך של 0 % לתוחלת השכר במשק. ב. מה ניתן לומר בביטחון של 0% על הסטייה המרבית בין ממוצע המדגם לתוחלת השכר? ג. מה היה צריך להיות גודל המדגם אם הינו רוצים להקטין את רווח הסמך ב 1%? ד. אם היינו מגדילים את גודל המדגם ובונים רווח סמך באותה רמת סמך האם היה ניתן לטעון בביטחון רב יותר שרווח הסמך מכיל את הפרמטר? בנו רווח סמך לממוצע הציונים של מבחן אינטליגנציה. ידוע שסטיית התקן היא 1 והמדגם מתבסס על 111 תצפיות. רווח הסמך שהתקבל הוא )00,11(. שחזרו את : א. ממוצע המדגם. ב. ג. שגיאת האמידה המקסימאלית. רמת הסמך..4.
43 זמן החלמה מאנגינה מתפלג עם סטיית תקן של יומיים. חברת תרופות מעוניינת לחקור אנטיביוטיקה חדשה שהיא פיתחה. במחקר השתתפו 31 אנשים שחלו באנגינה וקיבלו את האנטיביוטיקה החדשה. בממוצע הם החלימו לאחר 4 ימים. א. בנו רווח סמך לתוחלת זמן ההחלמה תחת האנטיביוטיקה החדשה ברמת סמך של.01% ב. מה היה קורה לאורך רווח הסמך אם היה תקציב להגדלת גודל המדגם פי 4? הסבירו. ג. מה היה קורה לאורך רווח הסמך אם היינו בונים את רווח הסמך ברמת סמך גדולה יותר? הסבירו..3 חוקר בנה רווח סמך לממוצע וקיבל את רווח הסמך הבא:. 8 9 נתון שסטיית התקן בהתפלגות שווה ל- 11 ושהמדגם מתבסס על 13 תצפיות. התפלגות המשתנה היא נורמאלית. א. מהו ממוצע המדגם? ב. מהי רמת הסמך של רווח הסמך שנבנה? ג. מה הסיכוי ששגיאת האמידה באמידת ממוצע האוכלוסייה תעלה על?.8 חוקר בנה רווח סמך לתוחלת כאשר השונות בהתפלגות ידועה ברמת סמך של 0%. אם החוקר כעת יבנה על סמך אותם נתונים רווח סמך ברמת סמך קטנה מ- 0%, מי מהמשפטים הבאים אינו יהיה נכון. א. אורך רווח הסמך החדש יהיה קטן יותר. ב. גודל המדגם יהיה כעת קטן יותר. ג. המרחק בין ממוצע המדגם לקצות רווח הסמך יהיו קטנים יותר ברווח הסמך החדש. ד. רמת הביטחון לבנות רווח הסמך החדש תהיה קטנה יותר..7 48 מה נכון בהכרח: חוקר בנה רווח סמך ל- וקיבל 54 א. 51 ב. X 6 ג. X 51 ד. אורך רווח הסמך הינו 0..0 איזה מהגורמים הבאים אינו משפיע על גודלו של רווח בר סמך, כאשר שונות האוכלוסייה ידועה? )בחר בתשובה הנכונה( א.רמת הביטחון. ב. ג. סטיית התקן באוכלוסייה. מספר המשתתפים. ד. סטיית התקן במדגם..11
44. 63 11. חוקר בנה רווח סמך לממוצע וקיבל את רווח הסמך הבא: 83 נתון שסטיית התקן בהתפלגות הייתה ידועה לו ושהמדגם התבסס על 41 תצפיות. א. אם החוקר היה רוצה לבנות רווח סמך באורך 11. כמה תצפיות עליו היה לדגום? ב. רווח הסמך שנבנה על ידי החוקר היה ברמת סמך של 0%. בנה את רווח הסמך שהיה מתקבל ברמת סמך של 07%. 15. נתון משתנה מקרי רציף מתפלג אחיד : X U( 0.5, 0.5) i.. נרצה לאמוד את. מצאו רווח סמך ל- ברמת-בטחון של 1.0 אם במדגם של 4 תצפיות התקבל: x 74 )תזכורת על השונות בהתפלגות אחידה רציפה: ) Var( X ) i b a 1
45 פתרונות : שאלה 4051.3> >4080.4 שאלה 3 א. >503.7 550.45> 508.74< ב. 555.13> שאלה 1 א. 115 ב. 0 ג. 1.044 שאלה 6 א. >4.45 70.> ב. יקטן פי 5 ג. גדל שאלה 7 א. 78 ב. ג. 1.044 שאלה 8 א. 100 ב. >5 51> שאלה 9 התשובה היא : ב שאלה 10 התשובה היא : ג שאלה 11 התשובה היא : ד
46 רקע: קביעת גודל מדגם באמידת תוחלת עם שונות אוכלוסייה ידועה 1 אם מעוניינים לאמוד את ממוצע האוכלוסייה כאשר סטיית התקן של האוכלוסייה ידועה: ברמת סמך של 1 ושגיאת אמידה שלא תעלה על מסוים, נציב בנוסחה הבאה: z n כדי להציב בנוסחה צריך שהמשתנה הנחקר יתפלג נורמלית או שהמדגם ייצא בגודל של לפחות 01 תצפיות. דוגמה: )פתרון בהקלטה ) חברת תעופה מעוניינת לאמוד את תוחלת משקל המטען של נוסע. נניח שמשקל מטען של נוסע מתפלג נורמאלית עם סטיית תקן של 5 ק"ג. כמה נוסעים יש לדגום אם מעוניינים שבביטחון של 07% הסטייה המרבית בין ממוצע המדגם לממוצע האמתי לא יעלה על 1. ק"ג? ( תשובה :78 )
47 תרגילים: 1. משתנה מקרי מתפלג נורמאלית עם סטיית תקן ידועה 15. מה צריך להיות גודל המדגם כדי לבנות רווח סמך ברמת סמך של 07% שאורכו לא יעלה על 5? 5. מעוניינים לאמוד את הדופק הממוצע של מתגייסים לצבא. מעוניינים שבביטחון של 0% שגיאת האמידה המרבית תהיה 1.. נניח שהדופק מתפלג נורמאלית על סטיית תקן של 0 פעימות לדקה. א. כמה מתגייסים יש לדגום? ב. אם ניקח מדגם הגדול פי 4 מהמדגם של סעיף א ונאמוד את הממוצע באותה רמת סמך כיצד הדבר ישפיע על שגיאת האמידה? יהי X משתנה מקרי עם ממוצע μ וסטיית תקן. σ חוקר רוצה לבנות רווח בר סמך ל μ ברמת ביטחון של 1.0 כך שהאורך של הרווח יהיה. 1.σ מהו גודל המדגם הנדרש?.0
48 פתרונות : שאלה 1 871 שאלה א. 100 ב. הדבר יקטין את פי 5. שאלה 3 n 6
49 רווח סמך לתוחלת )ממוצע האוכלוסייה( כששונות האוכלוסייה אינה ידועה רקע: בבואנו לבנות רווח סמך לתוחלת אנו צריכים להתמקד בשני המצבים הבאים: רווח סמך לתוחלת: שונות האוכלוסייה ידועה שונות האוכלוסייה אינה ידועה בפרק זה נעסוק במקרה ששונות האוכלוסייה אינה ידועה לנו.מקרה יותר פרקטי. X התנאי: ~ N או שהמדגם גדול X t ( n1) Sˆ n רווח סמך: n X X X i i nx ˆ i1 i1 S n1 n1 n האומד לשונות : התפלגות T: הינה התפלגות סימטרית פעמונית שהתוחלת שלה היא 1. ההתפלגות דומה להתפלגות Z רק שהיא יותר רחבה ולכן הערכים שלה יהיו יותר גבוהים. התפלגות T תלויה במושג שנקרא דרגות חופש. דרגות החופש הן.df=n-1 ככל שדרגות החופש עולות ההתפלגות הופכת להיות יותר גבוהה וצרה. כשדרגות החופש שואפות לאינסוף התפלגות T שואפת להיות כמו התפלגות Z.
51 דוגמה : )פתרון בהקלטה( הזמן שלוקח לפתור שאלה מסוימת בחשבון מתפלג אצל תלמידי כיתות ח' נורמאלית. במטרה לאמוד את תוחלת זמן הפתרון נדגמו 4 תלמידים בכיתה ח'. להלן התוצאות שהתקבלו בדקות: 4.8,.5,4.3,.0. בנו רווח סמך ברמת סמך של 0% לממוצע זמן הפתרון לשאלה בקרב תלמידי כיתה ח'. פתרון : 4.00> >.1
51 תרגילים: מחקר מעוניין לדעת כיצד תרופה מסוימת משפיעה על קצב פעימות הלב. ל- אנשים שנטלו את התרופה מדדו את הדופק והתקבל מספר פעימות לדקה: 70. 80, 74, 77, 74, הערה: לצורך פתרון הנח שקצב פעימות הלב מתפלג נורמאלית בקירוב. א. בנו רווח סמך ברמת סמך של 0 % לתוחלת הדופק של נוטלי התרופה הנ"ל. ב. נתון שהדופק הממוצע ללא לקיחת התרופה הינו 81. לאור זאת, האם בביטחון של 0% התרופה משפיעה על הדופק? ג. בהמשך לסעיף א, אם היינו בונים את רווח הסמך ברמת ביטחון של 00 % כיצד הדבר היה משפיע על רווח הסמך?.1 5. במדגם שנעשה על 5 מתגייסים לצבא האמריקאי התקבל כי : גובה ממוצע של חייל הינו 187 ס"מ עם סטיית תקן 13= Ŝ ס"מ. בנו רווח סמך ברמת סמך של 01 % לתוחלת גובה המתגייסים לצבא האמריקאי. מה יש להניח לצורך פתרון? אדם מעוניין לאמוד את זמן הנסיעה הממוצע שלו לעבודה. לצורך כך הוא דוגם ימים שזמן הנסיעה בהם בדקות הוא:. 58,04,05,41,01 א. ברמת ביטחון של 0% אמוד את זמן הנסיעה הממוצע. מהי ההנחה הדרושה לצורך פתרון? ב. איך גודל רווח הסמך היה משתנה אם היו דוגמים עוד ימים?.0 ציוני מבחן אינטליגנציה מתפלגים נורמאלית. נדגמו 5 מבחנים והתקבל ממוצע ציונים 115 וסטיית תקן מדגמית 10. א. בנו רווח סמך לממוצע הציונים באוכלוסייה ברמת ביטחון של 0%. ב. חזרו על סעיף א' אם סטיית התקן הינה סטיית התקן האמתית של כלל הנבחנים. ג. הסבירו את ההבדלים בין שני הסעיפים הנ"ל..4 60 i1 i נשקלו 31 תינוקות אשר נולדו בשבוע ה- 41 של ההיריון. המשקל נמדד בקילוגרמים. להלן 60 i1 X i 643.19 התוצאות שהתקבלו: X 195 לתוחלת משקל תינוק ביום היוולדו.. בנו רווח סמך ברמת סמך של 0%.
5 שני סטטיסטיקאים בנו רווח בר-סמך לאותו פרמטר. לכל אחד מהסטטיסטיקאים מדגם אחר, אך באותו גודל. 11 שניהם קבעו אותה רמת סמך. סטטיסטיקאי א : הניח = 51.3 סטטיסטיקאי ב : חישב לפי המדגם וקיבל ˆ 0 S למי משני הסטטיסטיקאים יהיה רווח סמך ארוך א. סטטיסטיקאי א ב. סטטיסטיקאי ב ג. אותו אורך רווח סמך לשני הסטטיסטיקאים. ד. תלוי בתוצאות המדגם של כל סטטיסטיקאי. יותר? ( בחר בתשובה הנכונה ) נתון ש : ), X )N ביצעו מדגם בגודל 13 וקיבלו סטיית תקן מדגמית 11. אורך רווח הסמך שהתקבל הוא:. 7.83 מהי רמת הביטחון של רווח הסמך?.8
53 טבלת ערכים קריטיים לפי התפלגות t ראה איור מטה. 0.1 0.05 0.05 0.01 0.005 0.001 0.0005 דרגות חופש 1 3.078 6.314 1.706 31.81 63.657 318.309 636.619 1.886.90 4.303 6.965 9.95.37 31.599 3 1.638.353 3.18 4.541 5.841 10.15 1.94 4 1.533.13.776 3.747 4.604 7.173 8.610 5 1.476.015.571 3.365 4.03 5.893 6.869 α 6 1.440 1.943.447 3.143 3.707 5.08 5.959 7 1.415 1.895.365.998 3.499 4.785 5.408 8 1.397 1.860.306.896 3.355 4.501 5.041 9 1.383 1.833.6.81 3.50 4.97 4.781 10 1.37 1.81.8.764 3.169 4.144 4.587 11 1.363 1.796.01.718 3.106 4.05 4.437 1 1.356 1.78.179.681 3.055 3.930 4.318 13 1.350 1.771.160.650 3.01 3.85 4.1 14 1.345 1.761.145.64.977 3.787 4.140 15 1.341 1.753.131.60.947 3.733 4.073 16 1.337 1.746.10.583.91 3.686 4.015 17 1.333 1.740.110.567.898 3.646 3.965 18 1.330 1.734.101.55.878 3.610 3.9 19 1.38 1.79.093.539.861 3.579 3.883 0 1.35 1.75.086.58.845 3.55 3.850 1 1.33 1.71.080.518.831 3.57 3.819 1.31 1.717.074.508.819 3.505 3.79 3 1.319 1.714.069.500.807 3.485 3.768 4 1.318 1.711.064.49.797 3.467 3.745 5 1.316 1.708.060.485.787 3.450 3.75 6 1.315 1.706.056.479.779 3.435 3.707 7 1.314 1.703.05.473.771 3.41 3.690 8 1.313 1.701.048.467.763 3.408 3.674 9 1.311 1.699.045.46.756 3.396 3.659 30 1.310 1.697.04.457.750 3.385 3.646 40 1.303 1.684.01.43.704 3.307 3.551 50 1.99 1.676.009.403.678 3.61 3.496 60 1.96 1.671.000.390.660 3.3 3.460 90 1.91 1.66 1.987.368.63 3.183 3.40 10 1.89 1.658 1.980.358.617 3.160 3.373 1.8 1.645 1.960.36.576 3.090 3.91
54 פתרונות: שאלה 1 א. > 70.85 80.77> שאלה 4 א. >118.08 03.30> ב. >118.11 03.01> שאלה 1 0.140> >0.01 שאלה 7 01%
55 רקע: פרק - 3 רווח סמך לפרופורציה מטרה: לאמוד את P פרופורציה באוכלוסייה. ( Y- מספר ההצלחות שבמדגם ) pˆ y n האומד הנקודתי: pˆ(1 pˆ) pˆ Z 1 n רווח הסמך ל p: התנאי לבנות את רווח הסמך הינו מדגם של לפחות 01 תצפיות) לעיתים נותנים תנאי של מספר הצלחות ומספר כשלונות לפחות או לפחות ) 11 pˆ(1 pˆ) n האומד לטעות התקן: L Pˆ A B מתקיים ש: דוגמה: )פתרון בהקלטה( במטרה לאמוד את אחוז המובטלים במשק נדגמו 511 אזרחים. מתוכם התקבל ש 54 היו מובטלים. בנו רווח סמך לאחוז המובטלים באוכלוסייה ברמת סמך של 0%. מהו האומד לטעות התקן?.1 א. ב. פתרון: א. 13.%<p<8.% ב. 5.50%
56 תרגילים: נדגמו 511 דירות בעיר חיפה. 47 מתוכן נמצאו כבעלות ממ"ד. א. בנו רווח סמך ברמת סמך של 0% לאחוז הדירות בחיפה עם ממ"ד. ב. על סמך סעיף א' מה ניתן לומר על שגיאת האמידה המקסימאלית? ג. בהנחה ובחיפה 71 אלף דירות, בנו רווח סמך ברמת סמך של 0 % למספר הדירות בחיפה עם ממ"ד בפועל..1 במדגם של 011 אנשי היי-טק התקבל ש- 171 מהם אקדמאים. א. בנו רווח סמך לפרופורציית אקדמאים ברמת סמך של 0% )בקרב אנשי היי-טק(. ב. כיצד רווח הסמך של סעיף א היה משתנה אם היינו מקטינים את רמת הסמך? ג. כיצד רווח הסמך היה משתנה אם הינו מגדילים את גודל המדגם?.5 במדגם של 411 נהגים התקבל רווח סמך לפרופורציית הנהגים החדשים: 0.08 p 0.18 א. כמה נהגים במדגם היו נהגים חדשים? ב. מהי רמת הסמך של רווח הסמך שנבנה?.0 במסגרת מערכת הבחירות בארה"ב נשאלו 741 אנשים עבור איזה מועמד יצביעו. 11 אנשים ענו כי יצביעו בעד ברק אובמה. בסקר פורסם שתתכן סטייה של 3% באיזו רמת ביטחון הסקר השתמש? האמת. מתוצאות.4 במדגם של 011 נשים בגילאי 0-41 נמצא ש- 141 היו נשואות, 71 היו גרושות, 31 רווקות והיתר אלמנות. א. מצאו רווח סמך ברמה של 01% לאחוז הגרושות באוכלוסייה הנחקרת. ב. מצאו רווח סמך ברמה של 00% לסיכוי שבאוכלוסייה הנחקרת תמצא אישה לא נשואה?. 3. ביצעו מדגם באוכלוסייה. שיעור ההצלחות במדגם היה 11% ורווח הסמך ניבנה ברמת סמך של. 0% אורכו הינו 7.013%. מהו גודל המדגם שנלקח?
57 פתרונות: שאלה 3 א. 5 ב. 1.008 שאלה 1 א. 01.0%<p<55.% ב. 31.85%<p<4.01% שאלה 6 511
58 רקע: קביעת גודל מדגם באמידת פרופורציה בפרק זה נדון איך קובעים גודל מדגם שבאים לאמוד פרופורציה באוכלוסייה מסוימת: החוקר קובע מראש את רמת הסמך הרצויה:.1 החוקר קובע מראש את הטעות הסטטיסטית המרבית שבה הוא מעוניין: ) או את אורך רווח הסמך(. - L אורך רווח הסמך. - טעות אמידה מרבית : המרחק המקסימאלי )הסטייה( בין הפרמטר ( p ) לאומד ( ˆp (. z 1. pˆ(1 pˆ) n ויתעניין לדעת מהו גודל המדגם הרצוי לשם כך. Z pˆ 1 pˆ 1 n L נקבל ש: הבעיה שאין אנו יודעים את ˆp. : pˆ 1 pˆ נתבונן בביטוי 3 3.5 1 כיוון שאין לנו ידע מוקדם על ˆp נציב את המקרה השמרני ביותר שממקסם את הביטוי עבור pˆ 0.5 z 0.5 0.5 z 1 1 n n L L
59 אך אם תהיה לנו אינפורמציה מוקדמת על הפרופורציה נציב את הערך הקרוב ביותר ל- 1. האפשרי. דוגמה: ( פתרון בהקלטה( מעוניינים לאמוד את שיעור האבטלה במשק. האמידה צריכה להתבצע ברמת סמך של 01% ועם שגיאת אמידה שלא תעלה על 4%. א. מהו גודל המדגם המינימאלי שיש לקחת? ב. חזור לסעיף א' אם ידוע שהאבטלה לא אמורה לעלות על 51%. פתרון : א. 450 ב. 581
61 תרגילים: הממשלה אומדת מדי חודש את אחוז התמיכה בה. מהו גודל המדגם אשר יש לקחת אם דורשים שהאומדן לא יסטה מהאחוז האמתי באוכלוסייה ביותר מ- 0%, וזאת בביטחון של 0%?.1 משרד התקשורת מעוניין לדעת מה שיעור בתי האב עם אינטרנט. א. כמה בתי אב יש לדגום אם מעוניינים שבביטחון של 01% אורך רווח הסמך לא יעלה על 7%? ב. חזרו על סעיף א. אם ידעו שלפני חמש שנים ל- 71% מבתי האב היה אינטרנט וכיום יש להניח שיש ליותר אינטרנט..5 ערוץ טלוויזיה מעוניין לאמוד את הרייטינג של הערוץ בפריים טיים. המטרה שבביטחון של 0% הסטייה המרבית בין האומד לרייטינג האמתי לא תעלה על 4%. א. כמה מכשירי PEOPLE METER יש להתקין לצורך האמידה? ב. לפי הערכה מוקדמת הרייטינג של הערוץ לא יכול לעלות על 51%. בהנחה ומכשיר כזה עולה 11 ליחידה מה החיסכון הכספי מאינפורמציה זאת?.0 השאלות הבאות מתייחסות לסעיף : 4 א. כמה אזרחים יש לדגום כדי לאמוד את אחוז התמיכה בממשלה עם אורך רווח הסמך שלא עולה על 0% ברמת סמך של 01%? ב. בהנחה ובוצע מדגם שאת גודלו חישבתם בסעיף א והתקבל שאחוז התמיכה בממשלה במדגם הנו 45%. בנו רווח סמך לאחוז התמיכה בממשלה ברמת סמך של 0%. ג. על סמך סעיף ב'. האם תקבל את הטענה שמיעוט האוכלוסייה תומך הממשלה?.4 משרד הבריאות מתכנן לבצע מדגם שמטרתו לבדוק את הסיכוי לחלות בשפעת עם לקיחת חיסון נגד שפעת. הוא מעוניין שבסיכוי של 07% טעות האמידה לא תעלה על 0%. א. כמה מחוסנים יש לדגום? ב. משרד הבריאות ביצע את המדגם שאת גודלו חישבת בסעיף הקודם וקיבל ש 1% מבין אלה שקיבלו חיסון נגד שפעת בכל זאת חלו במשך החורף בשפעת. בנו ברמת סמך של 07% את הסיכוי לחלות בחורף בשפעת עם לקיחת חיסון נגד שפעת. ג. בהמשך לסעיף הקודם. מהי טעות האמידה המרבית בביטחון של? 07% מדוע הוא קטן מ 0%?.
61 פתרונות: שאלה 1 1137 שאלה 3 א. 311 ב.. 117111
6 רקע: המטרה: לאמוד את פרק - 8 רווח סמך להפרש פרופורציות : p1 p הפרש פרופורציות בין שתי אוכלוסיות שונות. pˆ p 1 ˆ האומד הנקודתי: התנאי לבניית רווח הסמך: כל מדגם מעל 01 או לבדוק שמספר ההצלחות ומספר הכישלונות בכל מדגם לפחות בכל מדגם )יש כאלה שבודקים לפחות 11(. רווח סמך: pˆ 1(1 pˆ ˆ ˆ 1) p(1 p) ( pˆ ˆ 1 p) Z n n 1 1 רק שאפס נופל בתחומי רווח הסמך להפרש הפרופורציה נאמר שלא ניתן לקבוע שקיים הבדל מובהק בין הפרופורציות באוכלוסיות. דוגמה: )פתרון בהקלטה( במטרה להשוות בין שתי תרופות נדגמו 511 איש שלקחו תרופה x. מתוכם 171 טענו שהתרופה עזרה להם. כמו כן נלקחו 011 איש שלקחו את תרופה y. מתוכם 11 טענו שהתרופה עזרה להם. בנו רווח סמך להפרש אחוזי ההצלחה של התרופות ברמת סמך של 0%. מה ניתן לומר על סמך רווח הסמך על ההבדלים בין התרופות? ) 00%,48%( פתרון :
63 תרגילים: מתוך 11 נשים שנדגמו באקראי 01% תמכו בהצעת חוק מסוימת. מתוך 511 גברים שנדגמו באקראי 5% תמכו בהצעת החוק. א. בנו רווח סמך לפער בין אחוזי התמיכה של הנשים לעומת הגברים ברמת סמך של.03% ב. בנו רווח סמך ברמת סמך של 0% לאחוז התמיכה בהצעת החוק..1 במחקר רפואי השתתפו 511 אנשים הסובלים מכאבים כרוניים. הם חולקו באקראי ל- 5 קבוצות שוות בגודלן. קבוצה 1 קיבלה את תרופה A וקבוצה שנייה קיבלה את תרופה B. בקרב לוקחי תרופה 01 A טענו שמצבם השתפר. בקרב לוקחי תרופה 81 B טענו שמצבם השתפר. א. בנו רווח סמך ברמת סמך של 0% להפרש בין שיעורי ההצלחה של שתי התרופות. ב. האם על סמך סעיף א ניתן לקבוע שקיים הבדל בין התרופות מבחינת שיעורי ההצלחה?.5 נדגמו 511 משפחות מגוש דן. ל- 81% מתוכן מכשיר DVD בבית. נדגמו 011 משפחות מאזור הצפון ל- 3% מתוכן מכשיר DVD בבית. א. בנו רווח סמך ברמת סמך של 07% לפרופורציות המשפחות בגוש דן עם DVD בבית. ב. בנו רווח סמך ברמת סמך של 0% להפרש בין פרופורציות המשפחות בגוש דן עם.DVD לבין פרופורציות המשפחות בצפון עם DVD.0
64 פתרונות: שאלה 0.093 P P 0.307 A א. B שאלה 3 0.65 p 0.7754 א.
65 רקע: פרק - 7 רווח סמך להפרש תוחלות ממדגמים בלתי תלויים כששונויות האוכלוסייה ידועות מטרה: האוכלוסיות., כלומר ההבדלים של הממוצעים בין שתי 1 לאמוד את פער התוחלות: x1 x האומד נקודתי: התנאים לבניית רווח הסמך: n 1, n1 30 ידועות. 1, X1, X או ~ N 1..5 0. שני מדגמים בלתי תלויים. רווח סמך: ( x1 x) Z n n 1 1 1 אם הערך אפס נופל בגבולות רווח הסמך נגיד שבביטחון של 1 לא קיים הבדל בין התוחלות. דוגמה: )פתרון בהקלטה( נדגמו 111 תושבים מאזור a והמשכורת הממוצעת הייתה שם. 0511 כמו כן נדגמו 151 תושבים מאזור b וממוצע המשכורות שהתקבל שם. 7811 לצורך פתרון נניח שסטיית התקן של המשכורות באוכלוסיית שני האזורים היא. 1711 אמדו ברמת סמך של 01% את הפרש השכר הממוצע בין אזור a לאזור. b
66 תרגילים: מעוניינים לבדוק האם קיים הבדל בין ממוצע ציוני הפסיכומטרי של חיילים לממוצע ציוני הפסיכומטרי של תלמידי תיכון. ידוע שציוני הפסיכומטרי מתפלגים נורמאלית עם סטיית תקן 111. במדגם של 13 נבחנים חיילים התקבל ממוצע 40. במדגם של 51 תלמידי תיכון התקבל ממוצע 17. בנו רווח סמך לפער תוחלות הציונים בין חיילים לתלמידי תיכון ברמת סמך של 01%. מה ניתן להסיק מרווח סמך זה?.1 ציוני I.Q. מתוכננים כך שיתפלגו נורמאלית עם סטיית תקן של 1. במדגם של 51 נבחנים ישראלים התקבל ממוצע ציונים 114. במדגם של 50 נבחנים אמריקאיים התקבל ממוצע ציונים 00. א. בנו רווח סמך ברמת סמך של 0% לפער בין ישראל לארה"ב בממוצע הציונים במבחן ה- IQ. ב. האם קיים הבדל בין ישראלים לאמריקאים מבחינת ממוצע הציונים?.5 0. חברה להנדסת בניין מעוניינת להשוות ברמת הקשיות של שני סוגי ברגים. ידוע שרמת הקשיות של ברגים מתפלגת נורמלית עם סטיית תקן של 4 יחידות. במדגם של 1 ברגים מסוג א' התקבל רמת קשיות ממוצעת של 57 יחידות ובמדגם של 15 ברגים מסוג ב' התקבל רמת קשיות ממוצעת של. 5 עבור אילו רמות בטחון יקבע שאין הבדל בין שני סוגי הברגים מבחינת ממוצע רמת הקשיות שלהם?
67 פתרונות : שאלה 1 )-51,01( שאלה 3: רמות בטחון הגבוהות מ: 1.0483
68 כששונויות האוכלוסייה אינן ידועות אך שוות רקע: 1 מטרה: לאמוד את פער התוחלות: האוכלוסיות. האומד נקודתי: x1 x התנאים לבניית רווח הסמך:. 1 X1, X ~ N.1.5 0. מדגמים בלתי תלויים. Sˆ p, כלומר ההבדלים של הממוצעים בין שתי השונות המשוקללת : כיוון שאנו מניחים שבין שתי האוכלוסיות השונויות שוות אנו אומדים את השונות הזו על ידי שקלול שתי השונויות של שני המדגמים על ידי הנוסחה הבאה: 1 ˆ 1 n S n Sˆ 1 1 1 n n 1 דרגות החופש : d. f n n רווח סמך: Sˆ Sˆ n1n ( x1 x) t n n p p 1 אם הערך אפס נופל בגבולות רווח הסמך נגיד שבביטחון של 1 לא קיים הבדל בין התוחלות. דוגמה: )פתרון בהקלטה ) מחקר מעוניין לבדוק האם קיים הבדל בין תל אביב לבאר שבע מבחינת ההכנסה הממוצעת של אקדמאים.להלן תוצאות המדגם שנעשה: באר שבע תל אביב 11 51 מספר האקדמאים 011 11,111 ממוצע הכנסות של אקדמאים 51 511 סטיית התקן של הכנסות אקדמאים בנו רווח סמך ברמת ביטחון של 01% להפרש תוחלות ההכנסה בשני האזורים. הניחו שהשכר מתפלג נורמלית עם אותה שונות בכל אחד מהאזורים. פתרון : )108,1340(
69 נדגמו 1 ישראלים ו- 1 אמריקאים. תרגילים: כל הנדגמים נגשו למבחן.IQ להלן תוצאות המדגם:.1 המדינה גודל המדגם סכום הציונים סכום ריבועי הציונים ישראל 1 131 13,001 ארה"ב 1 1481 148,31 מצאו רווח סמך ברמת סמך של 0% לסטייה בין ממוצע הציונים בישראל לממוצע הציונים בארה"ב. רשמו את כל ההנחות הדרושות לצורך פתרון התרגיל.. N ( y, ) N( x להלן 4 תצפיות על משתנה X שמתפלג ), ומשתנה Y שמתפלג.5 X 55 51 51 5 Y 17 5 18 15 חשבו רווח סמך ל- ברמת הסמך 01%, בהנחה ששני המדגמים בלתי תלויים. y x
71 רקע: פרק - 0 רווח סמך לתוחלת ההפרש במדגם מזווג מדגם מזווג: מדגם אחד שבו יש n צמדים. כל תצפית במדגם תנפק זוג ערכים: X ניצור משתנה חדש: ו- Y. D x y הפרמטר שנרצה לאמוד: D התנאים לבניית רווח הסמך: x, y ~ N המדגם מזווג נוסחת רווח הסמך: D t n1 1 SD n d. f n כאשר דרגות החופש: 1
71 דוגמה: )פתרון בהקלטה( מעוניינים לבדוק האם יש הבדל בין מהירות הריצות של שתי תוכנות מחשב. לקחו קבצים אקראיים והריצו אותם בשתי התוכנות: 1 4 3 1 הקובץ 07 43 40 47 הזמן בתוכנה הראשונה 5 47 41 45 43 הזמן בתוכנה השנייה 58 הניחו כי זמני הריצות מתפלגים נורמלית. מ צאו רווח סמך של 0% להפרש תוחלת הזמן בין שתי התוכנות.
7 תרגילים: נדגמו סטודנטים שסיימו את הקורס סטטיסטיקה ב'. להלן הציונים בסמסטר א' ו- ב': סמסטר א סמסטר ב 71 84 74 37 78 01 83 8 111 75.1 נניח שהציונים מתפלגים נורמאלית. א. ב. ג. בנו רווח סמך ברמת סמך של 0% לתוחלת פער הציונים בין סמסטר א לבין סמסטר ב. האם על סמך רווח הסמך קיים הבדל בין הסמסטרים מבחינת תוחלת הציונים? מה צריך לשנות בנתונים כדי שהמדגמים יהיו בלתי תלויים? במטרה לבדוק האם קיים הבדל בין קווי זהב לבזק מבחינת ממוצע המחירים לשיחות בינ"ל. נגדמו באקראי 8 מדינות ועבור כל מדינה נבדקה עלות דקת שיחה. להלן התוצאות: המדינה בזק- X קווי זהב- Y.5 1.4 5 1.0 0.1 0.0 0.5 4.5 1. 5.1 5.5 0 0. 0.5 4.5 ארה"ב קנדה הולנד פולין מצרים סין יפן בהנחה והמחירים מתפלגים נורמלית עבור כל חברה בנו רווח סמך ברמת סמך של 01% לתוחלת הפרש המחירים של שתי החברות.
73 פרק - 11 רווח סמך לשונות וסטיית תקן רקע: בפרק זה נדון על בניית רווח סמך לשונות האוכלוסייה. התנאי לבניית רווח הסמך: המשתנה הנחקר מתפלג נורמלית, למרות שנהוג לא לדרוש את התנאי הזה אם המדגם מספיק גדול. רווח הסמך יתבסס על התפלגות הנקראת חי בריבוע. התפלגות זו היא התפלגות אסימטרית חיובית המתחילה מהערך אפס ותלויה בדרגות חופש. דרגות החופש במקרה זה יהיו: 1-n ( n1) Sˆ ( n1) S, n1 1, n1 ˆ רווח הסמך לשונות: כאשר n X X X i i nx ˆ i1 i1 S n1 n1 n אומד לשונות הלא-ידועה. אם נרצה לבנות רווח סמך לסטיית תקן אז נוציא שורש לרווח סמך לשונות.
74 דוגמה: )פתרון בהקלטה( זמן התגובה מתפלג נורמאלית. במטרה לאמוד את שונות זמן התגובה נדגמו 4 תצפיות. להלן התוצאות בשניות: 4.8,.5,4.3,.0. בנו רווח סמך, ברמת סמך של 0% לשונות זמן התגובה באוכלוסייה. פתרון : 1.100> >1.817
75 תרגילים : חמישה מטופלים קבלו תרופה מסוימת. בדקו לכל מטופל את זמני התגובה שלו. להלן הזמנים שהתקבלו בדקות: 17,18,51,53,57. בהנחה וזמני התגובה מתפלגים נורמאלית, בנו רווח סמך ברמת סמך של 0 % לשונות זמן התגובה..1 נדגמו 51 ימים אקראיים מחודשי יולי-אוגוסט ונמדדה בהם הטמפ' במעלות צלזיוס בת"א. במדגם התקבל טמפ' ממוצעת 01.7 וסטיית תקן מדגמית 1.1. בהנחה והטמפ' מתפלגת נורמאלית: א. בנו רווח סמך לתוחלת הטמפ' בחודשים אלה בת"א ברמת סמך של 0%. ב. בנו רווח סמך לסטיית התקן של הטמפ' בחודשים אלה בת"א ברמת סמך של 0%..5 ציוני IQ בארה"ב מתפלגים נורמאלית עם ממוצע 111 וסטיית תקן. נבחנו 51 נבחנים ישראלים במבחן ה- IQ. להלן התוצאות שהתקבלו :.0 0 Xi 080 i1 0 Xi 18, 0 i1 נניח שגם בישראל הציונים מתפלגים נורמאלית. א. מצאו אומדנים לממוצע הציונים בישראל ולשונות הציונים בישראל באמצעות אומדנים חסרי הטיה. ב. אמדו ברמת ביטחון של 0% את תוחלת הציונים של נבחנים בישראל. ג. אמדו ברמת סמך של 01% את סטיית התקן של הציונים של נבחנים ישראלים. ד. על סמך הסעיפים הקודמים, האם בישראל ממוצע הציונים וסטיית התקן של הציונים שונה מבארה"ב? הסבירו. 4. באוכלוסייה מסוימת נדגמו 11 תצפיות והתקבלו התוצאות הבאות: 10 Xi 750 i1 10 ( Xi X) 900 i1 נתון ש X i (, ) N א. בנו רווח סמך ל- ברמת סמך של 0%. ב. בנו רווח סמך ל- ברמת סמך של 0%.
76 פתרונות : שאלה א. 01.01 < 01.57> ב. >1.318 1.708> תשובה 3 א. לממוצע 114, לשונות 111. 99.3 ב. 108.68 7.94 ג. 13.7
77 טבלת חי בריבוע על סמך השטח מצד ימין α df 0.995.99.975.95.90.75.50.5.10.05.05.01.005 1 0.0 4 393 0.0 3 157 0.0 3 98 0.0 393 0.0158 0.10 0.455 1.3.71 3.84 5.0 6.63 7.88 0.0100 0.001 0.0506 0.103 0.11 0.575 1.39.77 4.61 5.99 7.38 9.1 10.6 3 0.0717 0.115 0.16 0.35 0.584 1.1.37 4.11 6.5 7.81 9.35 11.3 1.8 4 0.07 0.97 0.484 0.711 1.06 1.9 3.36 5.39 7.78 9.49 11.1 13.3 14.9 5 0.41 0.554 0.831 1.15 1.61.67 4.35 6.63 9.4 11.1 1.8 15.1 16.7 6 0.676 0.87 1.4 1.64.0 3.45 5.35 7.84 10.6 1.6 14.4 16.8 18.5 7 0.989 1.4 1.69.17.83 4.5 6.35 9.04 1.0 14.1 16.0 18.5 0.3 8 1.34 1.65.18.73 3.49 5.07 7.34 10. 13.4 15.5 17.5 0.1.0 9 1.73.09.70 3.33 4.17 5.90 8.34 11.4 14.7 16.9 19.0 1.7 3.6 10.16.56 3.5 3.94 4.87 6.74 9.34 1.5 16.0 18.3 0.5 3. 5. 11.60 3.05 3.8 4.57 5.58 7.58 10.3 13.7 17.3 19.7 1.9 4.7 6.8 1 3.07 3.57 4.40 5.3 6.30 8.44 11.3 14.8 18.5 1.0 3.3 6. 8.3 13 3.57 4.11 5.01 5.89 7.04 9.30 1.3 16.0 19.8.4 4.7 7.7 9.8 14 4.07 4.66 5.63 6.57 7.79 10. 13.3 17.1 1.1 3.7 6.1 9.1 31.3 15 4.60 5.3 6.6 7.6 8.55 11.0 14.3 18..3 5.0 7.5 30.6 3.8 16 5.14 5.81 6.91 7.96 9.31 11.9 15.3 19.4 3.5 6.3 8.8 3.0 34.3 17 5.70 6.41 7.56 8.67 10.1 1.8 16.3 0.5 4.8 7.6 30. 33.4 35.7 18 6.6 7.01 8.3 9.39 10.9 13.7 17.3 1.6 6.0 8.9 31.5 34.8 37. 19 6.84 7.63 8.91 10.1 11.7 14.6 18.3.7 7. 30.1 3.9 36. 38.6 0 7.43 8.6 9.59 10.9 1.4 15.5 19.3 3.8 8.4 31.4 34. 37.6 40.0 1 8.03 8.90 10.3 11.6 13. 16.3 0.3 4.9 9.6 3.7 35.5 38.9 41.4 8.64 9.54 11.0 1.3 14.0 17. 1.3 6.0 30.8 33.9 36.8 40.3 4.8 3 9.6 10. 11.7 13.1 14.8 18.1.3 7.1 3.0 35. 38.1 41.6 44. 4 9.89 10.9 1.4 13.8 15.7 19.0 3.3 8. 33. 36.4 39.4 43.0 45.6 5 10.5 11.5 13.1 14.6 16.5 19.9 4.3 9.3 34.4 37.7 40.6 44.3 46.9 6 11. 1. 13.8 15.4 17.3 0.8 5.3 30.4 35.6 38.9 41.9 45.6 48.3 7 11.8 1.9 14.6 16. 18.1 1.7 6.3 31.5 36.7 40.1 43. 47.0 49.6 8 1.5 13.6 15.3 16.9 18.9.7 7.3 3.6 37.9 41.3 44.5 48.3 51.0 9 13.1 14.3 16.0 17.7 19.8 3.6 8.3 33.7 39.1 4.6 45.7 49.6 5.3 30 13.8 15.0 16.8 18.5 0.6 4.5 9.3 34.8 40.3 43.8 47.0 50.9 53.7
78 פרק - 11 תרגול מסכם ברווחי סמך מהירות הגלישה באינטרנט במקום מסוים מתפלגת נורמאלית. בדקו את מהירות הגלישה ב- 01 זמנים אקראיים. מהירות הגלישה נמדדה ב- Mbps. מהירות מתחת ל- 11 Mbps מוגדרת על ידי החברה כנמוכה. התוצאות שהתקבלו במדגם : ממוצע היה 78 עם סטיית תקן 18 ו- 15 פעמים המהירות הייתה נמוכה. בנו רווחי סמך ברמת סמך של 0% לפרמטרים הבאים: א. תוחלת מהירות הגלישה. ב. הסיכוי שמהירות הגלישה תהיה נמוכה..1 511 אנשים נשאלו כמה פעמים ביום הם שותים כוס קפה. להלן התפלגות התשובות:.5 11 4 51 0 55 5 57 1 04 1 73 מספר פעמים מספר אנשים א. תנו רווח סמך לממוצע מספר כוסות הקפה שאנשים נוהגים לשתות ביום. 0.05 ב. אדם השותה לפחות 4 כוסות קפה ביום נקרא "מכור לקפה". בנו רווח סמך לאחוז "המכורים לקפה" 0.1 הוא חוקר בנה רווח סמך לאחוז האנשים שהתקררו לפחות פעם אחת בשנה. רווח הסמך שהתקבל 81 p 91 רווח הסמך הנ"ל התבסס על מדגם של 11 איש..0 א. כמה אנשים במדגם טענו שכלל לא התקררו השנה? ב. באיזו רמת סמך נבנה רווח הסמך? ג. בנו רווח סמך לאחוז האנשים שהתקררו לפחות פעם אחת השנה ברמת סמך של 0% על סמך תוצאות המדגם.
79 4. ציוני IQ בארה"ב מתפלגים נורמאלית עם תוחלת 111. במדגם של 51 ישראלים שנבחנו במבחן 0 i1 0 i1 x 040 x i i 10740 ה- IQ התקבלו התוצאות הבאות: א. אמדו ברמת ביטחון של 01% את ממוצע ציוני בחינת ה- IQ בישראל מהי ההנחה הדרושה לפתרון? ב. על סמך רווח הסמך של סעיף א האם תקבלו את הטענה שבישראל ממוצע הציונים שונה מארה"ב? ג. מה היה קורה לרווח הסמך אם הינו מגדילים את רמת הסמך שלו? להלן תוצאות מדגם שבדק עבור כל משפחה האם יש לה בבית מכשיר טאבלט. שאר הארץ גוש דן אזור מגורים 541 511 גודל המדגם 137 131 מספר משפחות בעלי טאבלט. א. בנו רווח סמך להבדל בין אחוז המשפחות עם טאבלט בגוש דן ואחוז המשפחות בעלי טאבלט בשאר חלקי הארץ. ברמת סמך של 07%. ב. בנו רווח סמך לפרופורצית משפחות בעלות טאבלט בכלל הארץ ברמת סמך של 0%. הגובה של מתגייסים לצה"ל מתפלג נורמלית במדגם של 5 מתגייסים התקבלו התוצאות הבאות:.3 x 176.cm ( x x) 83cm i אמדו את הגובה הממוצע של המתגייסים ברמת סמך של 07%. א. אמדו ברמת סמך של 01% את סטיית התקן של הגובה של מתגייסים של צה"ל. ב.
81 בנק מתלבט האם לפתוח סניף באזור A או באזור B.לצורך פתרון נניח שסטית התקן של המשכורת באזור A היא 1511 ובאזור 111 B.הבנק דגם 1 אנשים מאזור A, המשכורת הממוצעת שהתקבלה במדגם היא. 3,711 כמו כן נדגמו 41 אנשים מאזור B, המשכורת הממוצעת שהתקבלה במדגם היא. 3,311 א. בנו רווח סמך ברמת סמך של 0% להפרש הממוצעים של המשכורות בשני האזורים. האם על סמך רווח הסמך ניתן להמליץ לבנק היכן לפתוח את הסניף. אם כן, היכן? ב. בנו רווח סמך לתוחלת המשכורת באזור A ברמת סמך של 0%..8 להלן מדגם של שכר הדירה בש"ח של דירות שלושה חדרים בשכונת בבלי בתל אביב : 7. 811 311 8111 811 7111 שנת 5115 8811 3711 8711 7511 7111 שנת 5110 בנו רווח סמך ברמת סמך של 0% לתוחלת עליית שכר הדירה משנת 5115 לשנת 5110 בשכונת בבלי. ניתן להניח ששכר הדירה בשכונה מתפלג נורמלית.
81 שאלה 1 א. 93.35 80.65 ב. 0.575 0.5 p שאלה 1.1 א. 1.65 ב. 10.85% p 19.15% שאלה 3 א. 81 ב. 00.77% ג. 89% 83% p שאלה 4 97.4 א. 106.6 ב. לא ג. יגדל שאלה 1 א. 0.5% p p 19.5% פתרונות: 1 ב. 0.704 p 0.768 שאלה 6 170.8 א. 181.6 8.8 ב. 14.3 שאלה 7 א. 37 77 A B 6467 ב. 7133 שאלה 8 1 81 013 01
8 פרק - 15 בדיקת השערות כללית רקע: תהליך של בדיקת השערות הוא תהליך מאד נפוץ בעולם הסטטיסטיקה. בתהליך זה ישנן שתי השערות שנבדקות : השערת האפס המסומנות ב- H 0 והשערה אלטרנטיבית ( השערת המחקר ) המסומנת ב-. H 1 בדרך כלל השערת האפס מסמנת את אשר היה מקובל עד עכשיו, את השגרה הנורמה ואילו ההשערה האלטרנטיבית את החדשנות בעצם ההשערה האלטרנטיבית מדברת על הסיבה שהמחקר נעשה. למשל, ישנה תרופה קיימת למחלה A אשר גורמת ל % 11 מהמשתמשים בה לתופעות לוואי. חברת תרופות טוענת שפיתחה תרופה שיעילה באותה מידה, אך מקטינה את הסיכוי לתופעות הלוואי. לכן יש לבצע מחקר שעל סמך תוצאותיו ננסה להכריע איזה השערה נקבל: H 0 : התרופה החדשה הנה קונבנציונאלית וגורמת ל- 11% תופעות לוואי. : H 1 התרופה החדשה מקטינה את אחוז הסובלים מתופעות לוואי מתחת ל -11%. בתהליך של בדיקת השערות יוצרים כלל שניקרא כלל הכרעה : הכלל יוצר אזור שניקרא אזור דחייה ( דחייה של השערת האפס כלומר קבלה של האלטרנטיבה( ואזור קבלה ( קבלה של השערת האפס ודחייה של האלטרנטיבה(. כלל ההכרעה מתבסס על איזשהו סטטיסטי. בתהליך יש ללכת לתוצאות המדגם ולבדוק האם התוצאות נופלות באזור הדחייה או הקבלה וכך להגיע למסקנה המסקנה היא בעירבון מוגבל כיוון שהיא תלויה בכלל ההכרעה ובתוצאות המדגם. נשנה את כלל ההכרעה אנחנו יכולים לקבל מסקנה אחרת. נבצע מדגם חדש אנחנו עלולים לקבל תוצאה אחרת. לכן יתכנו טעויות במסקנות שלנו: הכרעה H0 H1 H0 אין טעות טעות מסוג 1 H1 טעות מסוג 5 אין טעות מציאות
83 הגדרת הטעויות: H 0 טעות מסוג ראשון- להכריע לדחות את H 0 למרות שבמציאות נכונה. H 1 טעות מסוג שני- להכריע לקבל את H 0 למרות שבמציאות נכונה. מה הן הטעויות האפשריות במחקר של התרופות? ( בהקלטה ) נגדיר את ההסתברויות הבאות: הסיכוי לבצע טעות מסוג ( 1 רמת מובהקות ) ) לדחות H 0 (= P H0 (H 0 נכונה לדחות את α=p)h 0 הסיכוי לבצע טעות מסוג 5: ) לקבל H 1 (=P H1 (H 0 נכונה לקבל את β =P)H 0 רמת בטחון: ) לקבל H 0 (= P H0 (H 0 נכונה לקבל את )1-α( =P)H 0 עוצמה : ) לדחות H 1 ( =P H1 (H 0 נכונה לדחות את π=)1-β ( =P)H 0 דוגמה: ( פתרון בהקלטה ) בכד יש 11 כדורים. יתכן ש- מהם לבנים והיתר שחורים )כד א- השערת האפס( או ש- 8 מהם לבנים והיתר שחורים )כד ב- השערה אלטרנטיבית(. כדי להחליט איזה מהכדים ברשותנו, הוחלט להוציא כדור ולהשתמש בכלל ההחלטה הבא: אם הכדור שהוצא הוא לבן שזהו כד ב' ( 1 H(. א. חשבו את רמת המובהקות ואת רמת הביטחון של המבחן המוצע. ב. חשבו את הסיכוי לטעות מסוג שני והעוצמה של המבחן המוצע.
84 תרגילים: 1. אדם חשוד בביצוע פשע. מהן הטעויות האפשריות בהכרעת הדין? ילד קנה שקית סוכריות אטומה שבה ציפה ל- 11 סוכריות תות ו- לימון. ישנה שקית אחרת אותה הוא לא רצה בה 3 סוכריות תות ו- 0 לימון.הוא החליט להוציא באקראי סוכרייה אם היא תהיה לימון הוא יחזיר את השקית לחנות. מה הסיכויים לכל סוג של טעות בהכרעתו?.5 יהי X מספר שלם הנבחר באקראי מבין המספרים השלמים. הסיכוי ש- X יקבל ערך 1 k 1,,..., n עבור p( X k) כלשהו נתון על ידי הנוסחה: n נתונות ההשערות הבאות לגבי התפלגות של X: H 0 1 : n 4 H : n 6 כמו כן נתון כלל ההכרעה הבא: נדחה את השערת האפס אם 3<X. חשבו את הסיכוי לטעות מסוג ראשון וטעות מסוג שני ואת העוצמה?.0 איכות של מוצר מסווגת ל- 4 רמות איכות: מצוין, טוב, בינוני וירוד. להלן התפלגות טיב המוצר בשני מפעלים: ירוד בינוני טוב מצוין מפעל 1 1.5 1.5 1.3 "היוצר" 1.4 1.0 1.5 1.1 "שמשון".4 בוחרים ממשלוח מוצר באקראי, אך לא יודעים מאיזה מפעל המשלוח הגיע. על סמך בדיקת האיכות מנסים להכריע האם מדובר במפעל "היוצר" )השערת האפס( או במפעל "שמשון" )השערה אלטרנטיבית(. א. להלן כלל החלטה: אם מדובר במוצר שטיבו "טוב" נכריע שהמוצר בא ממפעל "שמשון", מהן ההסתברויות לסוגי הטעויות השונים? ב. להלן כלל החלטה: אם מדובר במוצר שטיבו "בנוני" או גרוע מכך נכריע שהמוצר בא ממפעל "שמשון", מה מהן ההסתברויות לסוגי הטעויות השונים? ג. איזה כלל החלטה עדיף? נמק!
85 במטרה לבדוק האם מטבע תקין הטילו אותו 7 פעמים. הוחלט שאם מספר העצים יהיה בין 1 ל 8 כולל יוחלט שהמטבע תקין, אחרת נחליט שהמטבע מזויף. א. רשמו את השערות המחקר. ב. מה ההסתברות לטעות מסוג ראשון? ג. מהי עצמת המבחן אם במציאות אכן המטבע אינו תקין כי הסיכוי לעץ בו הוא 51%.. להלן השערות: H0 )התפלגות t עם דרגות חופש( : X ~ t(5) )התפלגות נורמאלית סטנדרטית( H1 : X ~ Z ((סטנדארטית כלל החלטה: נדחה את השערת האפס אם X גדול מ- 5.11. א. מהי רמת המובהקות של כלל ההחלטה? ב. מהי העוצמה של כלל ההחלטה?.3 במפעל מסוים נפלטים לאוויר חומרים רעילים. במצב שיגרה העוצמה הממוצעת של החומר הרעיל אמורה להיות 3,111 יחידות עם סטיית תקן 011. במצב חירום העוצמה הממוצעת היא 8,111 עם סטיית תקן 011. במפעל מערכת התראה נתמכת על ידי 0 חיישנים. אם ממוצע העוצמה של החומר הרעיל לפי תשעת החיישנים עולה על 3311 יחידות מופעלת מערכת ההתראה. נתון שעוצמת הזיהום מתפלגת נורמאלית. א. מה הסיכוי להתראת שווא? )באיזה סוג טעות מדובר(? ב. מה הסיכוי שבמצב חירום מערכת ההתראה לא תפעל? )באיזה סוג טעות מדובר(? מה ההסתברות שאם המצב הוא מצב חירום מערכת ההתראה תפעל? )איך קוראים ג. להסתברות זו(? בסעיפים הבאים נשנה בכל סעיף נתון מסוים. כל סעיף עומד בפני עצמו, כיצד השינוי ד. ישנה את הסיכוי לטעות מסוג ראשון ושני? המפעל יקנה עוד 4 חיישנים. 1. מצב חרום מוגדר כעת בתוחלת של 811 יחידות. 5. מערכת ההתראה תופעל אם ממוצע של תשעת החיישנים יהיה מעל 3811. 0..8 במטרה לבדוק האם במקום עבודה מסוים פרופורציית הבנים נמוכה מפרופורציית הבנות נדגמו באקראי 11 עובדים. הוחלט שאם מספר הבנים במדגם יהיה לכל היותר 5 תתקבל הטענה שפרופורציית הבנים נמוכה מפרופורציית הבנות. א. מה רמת המובהקות של כלל ההכרעה הנ"ל? ב. מהי העצמה בהנחה ובחברה 01% בנים?.7
86 זמן ההשפעה של משכך הכאבים "אופטלנוס" מתפלג נורמאלית עם תוחלת של 41 דקות וסטיית תקן של 15 דקות. חברת התרופות המייצרת את התרופה מנסה לשפר את התרופה כך שתוחלת הזמן עד להשפעה תתקצר. לצורך כך, דגמו 5 מטופלים שיקבלו את התרופה "אופטלנוס פורטה", ממוצע זמן התגובה של המטופלים היה 04. דקות. חברת התרופות החליטה מראש שאם ממוצע הזמן עד להשפעה יהיה נמוך מ 0 דקות, היא תמשיך בתהליך שיווק "אופטלנוס פורטה". א. מהי רמת המובהקות של המבחן המוצע? ב. על סמך תוצאות המדגם. מהי המסקנה ומהי הטעות האפשרית במסקנה? ג. מהי עצמת המבחן המוצע אם במציאות התרופה "אופטלנוס פורטה" מפחיתה את התוחלת לכדי 05 דקות? ד. כיצד תשתנה התשובה לסעיף ג' אם החברה הייתה מחליטה שהיא תמשיך בתהליך שיווק התרופה החדשה כאשר ממוצע המדגם יהיה נמוך מ- 03 דקות?.0 11. ציוני פסיכומטרי מתפלגים נורמלית עם סטיית תקן 151. מכון טוען שלימודים אצלו מעלים את ממוצע הציונים ביותר מ- 01 נקודות. נלקחו 51 שלמדו במכון ו- 51 שניגשו לבחינה בלמידה עצמית. הוחלט במשרד פרסום לקבל את טענת המכון רק אם במדגם ממוצע הציונים של אלה שלמדו במכון יהיה גבוהה בלפחות 1 נקודות מאלה שלא היו. א. מהי רמת המובהקות של המחקר? ב. מה הסיכוי לעשות טעות מסוג שני II בהנחה שהמכון מעלה את ממוצע הציונים ב- 31 נקודות? ג. כיצד התשובות לסעיף א ו ב' היו משתנות אם מסתבר שסטיית התקן בציוני הפסיכומטרי הינה 111. הסבירו ללא חישוב. קו ייצור נחשב תקין אם יש בו לכל היותר 4% פגומים, ונחשב שאינו תקין אחרת. מנהל האיכות דוגם בכל יום מקו הייצור 11 מוצרים. אם במדגם יהיה לפחות 01 מוצרים פגומים יפסיקו באותו היום את קו הייצור. א. מה ההסתברות להפסיק את קו הייצור כשהוא תקין. איך קוראים להסתברות זאת? ב. מה ההסתברות להמשיך ביום מסוים את קו הייצור למרות שאינו תקין כי היו 7% פגומים בקו הייצור. איך קוראים להסתברות זאת?.11 מעוניינים לבדוק האם בפקולטה מסוימת ישנה העדפה לגברים. הוחלט לדגום 511 מתקבלים ועל סמך מספר הבנים לקבוע אם טענת המחקר מתקבלת. חוקר א' קבע רמת מובהקות של % וחוקר ב' החליט לקבל את טענת המחקר אם במדגם יהיו לפחות 151 בנים. למי מבין החוקרים רמת מובהקות גדולה יותר?.15
87 פתרונות: 5 0.5 שאלה 1 3 שאלה 3 0.5 שאלה 4 0.8 0. 0.3 0. א. ב. ג. כלל ב' שאלה 1 1.11871 1.1387 ב. ג. שאלה 6 א. 1.1 ב. 1.155 שאלה 7 א. 1.1557 ב. 1.1017 ג. 1.0175 שאלה 8 א. 1.1 ב. 1.070 שאלה 10 א. 1.5071 ב. 1.0084 ג. קטן שאלה 11 א. 1.1110 ב. 1.140
88 שאלה 1 חוקר א
89 פרק - 10 בדיקת השערות על פרמטרים הקדמה רקע: תהליך של בדיקת השערות הוא תהליך מאד נפוץ בעולם הסטטיסטיקה. בבדיקת השערות על פרמטרים נעבוד לפי השלבים הבאים: שלב א: נזהה את הפרמטר הנחקר. שלב ב: נרשום את השערות המחקר. השערת האפס המסומנות ב- בדרך כלל השערת האפס מסמלת את אשר היה מקובל עד עכשיו, את השגרה הנורמה. השערה אלטרנטיבית ( השערת המחקר ) המסומנת ב-. H 1 H 0 ההשערה האלטרנטיבית מסמלת את החדשנות בעצם ההשערה האלטרנטיבית מדברת על הסיבה שהמחקר נעשה היא שאלת המחקר. שלב ג : נבדוק האם התנאים לביצוע התהליך מתקיימים ונניח הנחות במידת הצורך. שלב ד: נרשום את כלל ההכרעה. בתהליך של בדיקת השערות יוצרים כלל שניקרא כלל הכרעה : הכלל יוצר אזור שניקרא אזור דחייה ( דחייה של השערת האפס כלומר קבלה של האלטרנטיבה( ואזור קבלה ( קבלה של השערת האפס ודחייה של האלטרנטיבה(. כלל ההכרעה מתבסס על איזשהו סטטיסטי. אזור הדחיה מוכתב על ידי סיכון שלוקח החוקר מראש שנקרא רמת מובהקות ומסומן ב- α. שלב ה: בתהליך יש ללכת לתוצאות המדגם ולחשב את הסטטיסטי המתאים ולבדוק האם התוצאות נופלות באזור הדחייה או הקבלה. שלב ו : להסיק מסקנה בהתאם לתוצאות המדגם.
91 דוגמה: ( פתרון בהקלטה( משרד הבריאות פרסם שמשקל ממוצע של תינוקות ביום היוולדם בישראל 0011 גר'. משרד הבריאות רוצה לחקור את הטענה שנשים מעשנות בזמן ההיריון יולדות תינוקות במשקל נמוך מהממוצע. במחקר השתתפו 51 נשים מעשנות בהריון. להלן תוצאות המדגם שבדק את המשקל של התינוקות בעת הלידה: n 0 X 310 S 80 א. מהי אוכלוסיית המחקר? ב. מה המשתנה הנחקר? ג. מה הפרמטר הנחקר? ד. מהן השערות המחקר?
91 תרגילים: ממוצע הציונים בבחינת הבגרות באנגלית הנו 85 עם סטיית תקן 1 נקודות. מורה טוען שפיתח שיטת לימוד חדשה שתעלה את ממוצע הציונים. משרד החינוך החליט לתת למורה 03 תלמידים אקראיים. ממוצע הציונים של אותם תלמידים לאחר שלמדו בשיטתו היה 8.. מהי אוכלוסיית המחקר? א. מה המשתנה הנחקר? ב. מה הפרמטר הנחקר? ג. מהן השערות המחקר? ד..1 לפי הצהרת היצרן של חברת משקאות מסוימת נפח הנוזל בבקבוק מתפלג נורמלית עם סמ"ק. אגודת הצרכנים מתלוננת על הפחתת נפח 51 סמ"ק וסטיית תקן 11 תוחלת המשקה בבקבוק מהכמות המוצהרת. במדגם שעשתה אגודת הצרכנים התקבל נפח ממוצע של 405 סמ"ק במדגם בגודל 5. מהי אוכלוסיית המחקר? א. מה המשתנה הנחקר? ב. מה הפרמטר הנחקר? ג. ד. מהן השערות המחקר?.5 במשך שנים אחוז המועמדים שהתקבל לפקולטה למשפטים היה 5%. השנה מתוך מדגם של 151 מועמדים התקבלו 55. מחקר מעוניין לבדוק האם השנה מקשים על הקבלה לפקולטה למשפטים. א. מהי אוכלוסיית המחקר? ב. מה המשתנה הנחקר? ג. מה הפרמטר הנחקר? ד. מהן השערות המחקר?.0 4. בחודש ינואר השנה פורסם שאחוז האבטלה במשק הוא 7% במדגם עכשווי התקבל שמתוך 511 אנשים 3.% מובטלים. רוצים לבדוק ברמת מובהקות של % האם כיום אחוז האבטלה הוא כמו בתחילת השנה. א. מהי אוכלוסיית המחקר? ב. מה המשתנה הנחקר? ג. מה הפרמטר הנחקר? ד. מהן השערות המחקר?
9 רקע: טעויות בבדיקת השערות בתהליך של בדיקת השערות יוצרים כלל שניקרא כלל הכרעה : הכלל יוצר אזור שניקרא אזור דחייה ( דחייה של השערת האפס כלומר קבלה של האלטרנטיבה( ואזור קבלה ( קבלה של השערת האפס ודחייה של האלטרנטיבה(. כלל ההכרעה מתבסס על איזשהו סטטיסטי. בתהליך יש ללכת לתוצאות המדגם ולבדוק האם התוצאות נופלות באזור הדחייה או הקבלה וכך להגיע למסקנה המסקנה היא בעירבון מוגבל כיוון שהיא תלויה בכלל ההכרעה ובתוצאות המדגם. נשנה את כלל ההכרעה אנחנו יכולים לקבל מסקנה אחרת. נבצע מדגם חדש אנחנו עלולים לקבל תוצאה אחרת. לכן יתכנו טעויות במסקנות שלנו: הכרעה H0 H1 מציאות 1 טעות מסוג אין טעות H0 טעות מסוג H1 5 אין טעות הגדרת הטעויות: טעות מסוג ראשון- להכריע לדחות את למרות שבמציאות H 0 נכונה. H 0 טעות מסוג שני- להכריע לקבל את למרות שבמציאות H 1 נכונה. H 0 דוגמה: )פתרון בהקלטה( אדם חשוד בביצוע עבירה ונתבע בבית המשפט. אילו סוגי טעויות אפשריות בהכרעת הדין?
93 תרגילים: לפי הצהרת היצרן של חברת משקאות מסוימת נפח הנוזל בבקבוק מתפלג נורמלית עם תוחלת 11 סמ"ק וסטיית תקן 51 סמ"ק. אגודת הצרכנים מתלוננת על הפחתת נפח המשקה בבקבוק מהכמות המוצהרת. במדגם שעשתה אגודת הצרכנים התקבל נפח ממוצע של 405 סמ"ק במדגם בגודל 5. בסופו של דבר הוחלט להכריע לטובת חברת המשקאות. א. רשמו את השערות המחקר. מה מסקנת המחקר? ב. איזו סוג טעות יתכן וביצעו במחקר? ג..1 5. במחקר על פרמטר מסוים הוחלט בסופו של דבר לדחות את השערת האפס. א. האם ניתן לדעת אם בוצע טעות במחקר? ב. מה סוג הטעות האפשרית? 0. לפי נתוני משרד הפנים בשנת 1071 למשפחה ממוצעת היה 5.0 ילדים למשפחה עם סטיית תקן 1.4. ישנה טענה שכיום ממוצע מספר הילדים במשפחה קטן יותר. לצורך כך הוחלט לדגום 151 משפחות. במדגם התקבל ממוצע 5.18 ילדים למשפחה. על סמך תוצאות המדגם נקבע שלא ניתן לקבוע שבאופן מובהק תוחלת מספר הילדים למשפחה קטנה כיום. א. מהי אוכלוסיית המחקר? ב. מה המשתנה הנחקר? ג. מה הפרמטר הנחקר? ד. מה השערות המחקר? ה. מה מסקנת המחקר? ו. מהי סוג הטעות האפשרית במחקר?
94 פרק - 14 בדיקת השערות על תוחלת )ממוצע( כאשר שונות האוכלוסיה ידועה רקע: H : 0 0 H : 1 0 H : 0 0 H : 1 0 H H 0 1 : : 0 0 השערת האפס : השערה אלטרנטיבה:.1 תנאים: ידועה X או מדגם מספיק גדול N.5 Z x Z 1 Z x Z1 Z x Z 1 כלל ההכרעה: Z x או Z 1 : H 0 אזור הדחייה של H 0 Z1 - דוחים את Z1 H 0 - דוחים את Z Z 1 1 H 0 - דוחים את סטטיסטי המבחן : Z X X 0 n חלופה אחרת לכלל הכרעה: X Z 0 1 n X Z 0 1 n X X Z 0 Z 0 n n נדחה H 0 אם מתקיים: או 1 / 1 /
95 דוגמה : )פתרון בהקלטה( יבול העגבניות מתפלג נורמלית עם תוחלת של 11 טון לדונם וסטיית תקן של 5. טון לדונם בעונה. משערים ששיטת זיבול חדשה תעלה את תוחלת היבול לעונה מבלי לשנות את סטיית התקן. נדגמו 4 חלקות שזובלו בשיטה החדשה. היבול הממוצע שהתקבל היה 15. טון לדונם. בדוק את ההשערה ברמת מובהקות של 1%.
96 תרגילים: ממוצע הציונים בבחינת הבגרות באנגלית הנו 85 עם סטיית תקן 1 נקודות. מורה טוען שפיתח שיטת לימוד חדשה שתעלה את ממוצע הציונים. משרד החינוך החליט לתת למורה 03 תלמידים אקראיים. ממוצע הציונים של אותם תלמידים לאחר שלמדו בשיטתו היה 8.. בהנחה שגם בשיטתו סטיית התקן תהייה 1 מה מסקנתכם ברמת מובהקות של %?.1 5. לפי הצהרת היצרן של חברת משקאות מסוימת נפח הנוזל בבקבוק מתפלג נורמלית עם תוחלת 11 סמ"ק וסטיית תקן 51 סמ"ק. אגודת הצרכנים מתלוננת על הפחתת נפח המשקה בבקבוק מהכמות המוצהרת. במדגם שעשתה אגודת הצרכנים התקבל נפח ממוצע של 405 סמ"ק במדגם בגודל 5. א. מה מסקנתכם ברמת מובהקות של 5.%? ב. האם ניתן לדעת מה תהיה המסקנה עבור רמת מובהקות הגבוהה מ- %? מהנדס האיכות מעוניין לבדוק אם מכונה מכוילת )מאופסת(. המכונה כוונה לחתוך מוטות באורך 1 ס"מ. לפי נתוני היצרן סטיית התקן בחיתוך המוטות היא 1. ס"מ. במדגם של 1 מוטות התקבל ממוצע אורך המוט 1.00 ס"מ.מה מסקנתכם ברמת מובהקות של %?.0 4. המשקל הממוצע של הספורטאים בתחום ספורט מסוים הוא 01 ק"ג, עם סטיית תקן 7 ק"ג. לפי דעת מומחים בתחום יש צורך בהורדת המשקל ובשימוש בדיאטה מסוימת שצריכה להביא להורדת המשקל. לשם בדיקת יעילות הדיאטה נלקח מדגם מקרי של 1 ספורטאים ובתום שנה של שימוש בדיאטה התברר שהמשקל הממוצע במדגם זה היה 74 ק"ג. יש לבדוק בר"מ של 11%, האם הדיאטה גורמת להורדת המשקל.. לפי מפרט נתון, על עובי בורג להיות 4 מ"מ עם סטיית תקן של 1.5 מ"מ. במדגם של 5 ברגים העובי הממוצע היה 4.18 מ"מ. קבעו ברמת מובהקות 1.1, האם עובי הברגים מתאים למפרט. הניחו כי עובי של בורג מתפלג נורמלית וסטיית התקן של עובי בורג היא אכן 1.5 מ"מ.
97 בחר בתשובה במחקר נמצא שתוצאה היא מובהקת ברמת מובהקות של % מה תמיד נכון? 3. הנכונה. א. הגדלת רמת המובהקות לא תשתנה את מסקנת המחקר. ב. הגדלת רמת המובהקות תשנה את מסקנת המחקר. ג. הקטנת רמת המובהקות לא תשנה את מסקנת המחקר. ד. הקטנת רמת המובהקות תשנה את מסקנת המחקר. 8. חוקר ערך מבחן דו צדדי ברמת מובהקות של והחליט לדחות את השערת האפס. אם החוקר היה עורך מבחן צדדי ברמת מובהקות של א. השערת האפס הייתה נדחית. ב. השערת האפס הייתה לא נדחית. ג. לא ניתן לדעת מה תהיה מסקנתו במקרה זה. אזי בהכרח: )בחר בתשובה הנכונה ) שני סטטיסטיקאים בדקו השערות H0: 0 כנגד H1: 0 עבור שונות ידועה ובאותה רמת מובהקות. שני החוקרים קבלו אותו ממוצע במדגם אך לחוקר א' היה מדגם בגודל 111 ולחוקר ב' מדגם בגודל 511. א. אם חוקר א' החליט לדחות את ב. אם חוקר א' יחליט לא לדחות את, H 0 מה יחליט חוקר ב'? נמקו., H 0 מה יחליט חוקר ב'? נמקו..7
98 פתרונות : שאלה 1: H 0 נקבל שאלה : H 0 נדחה שאלה 3: H 0 נדחה שאלה 4: H 0 נדחה שאלה 1: H 0 נקבל שאלה 6: א שאלה 7: ג שאלה 8: א. אותה מסקנה ב. לא ניתן לדעת.
99 סיכוי לטעויות ועוצמה כאשר שונות האוכלוסייה ידועה רקע: הכרעה מציאות H0 H1 טעות מסוג 1 אין טעות H0 H1 אין טעות טעות מסוג 5 נגדיר את ההסתברויות הבאות: הסיכוי לבצע טעות מסוג ( 1 רמת מובהקות ) ) לדחות H 0 (= P H0 (H 0 נכונה לדחות את α=p)h 0 הסיכוי לבצע טעות מסוג : ) לקבל H 1 (=P H1 (H 0 נכונה לקבל את β =P)H 0 רמת בטחון: ) לקבל H 0 (= P H0 (H 0 נכונה לקבל את )1-α( =P)H 0 עוצמה : ) לדחות H 1 ( =P H1 (H 0 נכונה לדחות את π=)1-β ( =P)H 0
111 התהליך לחישוב סיכוי לטעות מסוג שני: H : 0 0 H : 1 0 H : 0 0 H : 1 0 H H 0 1 : : 0 0 השערת האפס : השערה אלטרנטיבה:.0 תנאים: ידועה X או מדגם מספיק גדול N.4 X Z 0 1 n X Z 0 1 n X X Z 0 Z 0 n n : H 0 כלל ההכרעה: אזור הדחייה של או 1 / 1 / P ( X Z ) H 0 1 1 n P ( X Z ) H 0 1 1 n P ( Z X Z ) n n H 0 0 1 1 1 חישוב : β X ~ N(, ) n התפלגות ממוצע המדגם : x התקנון : Z n
111 דוגמה : )פתרון בהקלטה( בתחילת השנה חשבון הטלפון הסלולארי הממוצע לאדם היה 511 עם סטיית תקן של 71 לחודש. בעקבות כניסתן של חברות טלפון סלולארית חדשות מעוניינים לבדוק האם כיום ממוצע חשבון הטלפון הסלולארי פחת. לצורך בדיקה דגמו באקראי 03 אנשים וחשבון הטלפון הסלולארי שלהם היה 11 בממוצע לחודש. א. רשמו את השערות המחקר ובנו כלל הכרעה במונחי חשבון ממוצע מדגמי ברמת מובהקות של %. ב. מה מסקנתכם? איזה סוג טעות אפשרית במסקנה? ג. נניח שבמציאות כיום החשבון הממוצע הוא. 131 מה הסיכוי לבצע טעות מסוג שני? ד. אם נקטין את רמת המובהקות מסעיף א', כיצד הדבר ישפיע על התשובה מסעיף ג'?
11 תרגילים: נתון ש 1) X N(, להלן השערות של חוקר לגבי הפרמטר :.1 H : 5 0 H: 7 1 מעוניינים ליצור כלל הכרעה המתבסס על הסמך תצפית בודדת כך שרמת המובהקות תהיה.% א. עבור אילו ערכים של X שידגם נדחית השערת? H 0 ב. מה הסיכוי לבצע טעות מסוג שני? ג. אם במדגם התקבל ש. 69 X מה תהיה המסקנה ומה הטעות האפשרית? לפי נתוני משרד הפנים בשנת 1071 למשפחה ממוצעת היה 5.0 ילדים למשפחה עם סטיית תקן 1.4. מעוניינים לבדוק אם כיום ממוצע מספר הילדים למשפחה קטן יותר. לצורך כך הוחלט לדגום 151 משפחות. במדגם התקבל ממוצע 5.18 ילדים למשפחה. א. רשמו כלל הכרעה במונחי ממוצע מדגם קריטי ברמת מובהקות של %. ב. בהמשך לסעיף א מה תהיה המסקנה ומהי הטעות האפשרית במסקנה? ג. אם באמת ממוצע מספר הילדים במשפחה פחת לכדי 5.1 מהי העצמה של הכלל מסעיף א?.5 להלן נתונים על תהליך של בדיקת השערות על תוחלת: : 00 : 00 30 n 5 א. רשום כלל הכרעה במונחי ממוצע מדגם קריטי וברמת מובהקות של 11%. ב. בהמשך לסעיף א מהי העצמה אם התוחלת שווה ל- 10? ג. הסבר ללא חישוב איך העצמה תשתנה אם רמת המובהקות תהייה %? H H 0 1.0
113 מפעל לייצור צינורות מייצר צינור שקוטרו מתפלג נורמלית עם תוחלת של 1 מ"מ וסטית תקן של 3 מ"מ. במחלקת ביקורת האיכות דוגמים בכל יום 71 צינורות ומודדים את קוטרם, בכדי לבדוק, בעזרת מבחן סטטיסטי, האם מכונת הייצור מכוילת כנדרש או שקוטר הצינורות קטן מהדרוש. א. רשום את ההשערות ואת כלל ההכרעה ברמת מובהקות של %. ב. אם ביום כלשהו מכונת הייצור התקלקלה והיא מייצרת את הצינורות בקוטר שתוחלתו 47 מ"מ בלבד )סטית התקן לא השתנתה(, מה ההסתברות שהתקלה לא תתגלה בביקורת האיכות? כיצד נקראת הסתברות זו? ג. הסבר ללא חישוב כיצד התשובה לסעיף ב תשתנה אם רמת המובהקות תגדל. ד. הסבר ללא חישוב כיצד התשובה לסעיף ב תשתנה אם התוחלת האמיתית היא 48 ולא 47 מ"מ..4 0 1 להלן השערות של מחקר H : 50 H : 58 מעוניינים לדגום 111 תצפיות. ידוע שסטיית התקן של ההתפלגות הינה 51. א. בנו כלל הכרעה שהסיכוי לטעות מסוג שני בו הוא. 11% מהי רמת המובהקות? ב. כיצד הייתה משתנה רמת המובהקות אם )כל סעיף בפני עצמו(? 1. סטיית התקן הייתה יותר גדולה. 5. הסיכוי לטעות מסוג שני גדול יותר.. השאלות שלהלן הן שאלות רב בררתיות. בחר בכל שאלה את התשובה הנכונה ביותר: אם חוקר החליט להגדיל את רמת המובהקות במחקר שלו אזי: א. הסיכוי לטעות מסוג ראשון גדל. ב. העוצמה של המבחן גדלה. ג. הסיכוי לטעות מסוג שני גדל. ד. תשובות א ו-ב נכונות. חוקר ביצע מחקר ובו עשה טעות מסוג שני לכן: א. השערת האפס נכונה. ב. השערת האפס נדחתה. ג. השערת האפס לא נדחתה. ד. אף אחת מהתושבות לא נכונה בהכרח..3.8
114 מה המצב הרצוי לחוקר המבצע בדיקת השערה: 1 גדולה גדולה א. קטנה גדולה ב. גדולה קטנה ג. קטנה קטנה ד..7 H 0 נערך שינוי בכלל ההחלטה של בדיקת השערה מסוימת ובעקבותיו אזור דחיית קטן. כל שאר הגורמים נשארו ללא שינוי. כתוצאה מכך:.0 א. הן, והן ) - 1(, יקטנו. ב. יישאר ללא שינוי ואילו ) - 1( יגדל. ג. יגדל ואילו ) - 1( יקטן. ד. הן והן ) - 1( יגדלו. ידוע כי לחץ דם תקין באוכלוסייה הוא. 151 רופא מניח שלחץ הדם בקרב עיתונאים גבוה יותר מהממוצע באוכלוסייה. הוא לקח מדגם של 31 עיתונאים וקיבל ממוצע 108. על סמך המדגם, הוא בודק טענתו ברמת מובהקות 1.15 ומסיק שלחץ הדם בקרב העיתונאים אינו גבוה יותר. מה הטעות האפשרית שהרופא עושה? א. טעות מסוג ראשון. ב. טעות מסוג שני. ג. טעות מסוג שלישי. ד. אין טעות במסקנתו..11
115 פתרונות : שאלה 1: א. מעל 3.34 ב. 1.0305 שאלה : X.4 א. נדחה H 0 אם ב. נדחה H 0 ג. 1 שאלה 3: X X 03.9 א. נדחה H 0 אם או 196.71 ב. 1.711 ג. תקטן. שאלה 4: X 48.9 א. נדחה H 0 אם ב. 1.177 ג. תקטן. ד. תקטן. שאלה 6: ד שאלה 7: ג שאלה 8: ג שאלה 9: א שאלה 10: ב
116 רקע: קביעת גודל מדגם כששונות האוכלוסיה ידועה H : 0 0 H : 1 1 השערות המחקר הן : סטיית התקן של האוכלוסייה ידועה ומעוניינים לבצע מחקר שרמת המובהקות לא תעלה על α והסיכוי לטעות מסוג שני לא יעלה על β. הנוסחה הבאה נותנת את גודל המדגם הרצוי : 1 Z1 ( Z ) n 0 1 דוגמה: )פתרון בהקלטה( משרד החינוך מפעיל בגן חובה שיטת חינוך שפותחה בשנת 100. לפי שיטת חינוך זו תוחלת הציון במבחן אוצר מילים לגיל הרך הוא 81. אנשי חינוך החליטו לבדוק שיטת חינוך שפותחה בהולנד הנותנת שם תוחלת ציון אוצר מילים של 71. נניח שציוני מבחן זה מתפלגים נורמאלית עם. 17 כדי לבדוק האם גם בישראל הפעלת שיטת החינוך ההולנדית תעבוד בגנים, רוצים לבנות מחקר ברמת מובהקות של %. כמו כן, מעוניינים שאם בהפעלת השיטה ההולנדית תוחלת הציונים תעלה לכדי 71, המחקר יגלה זאת בסיכוי של 01%. כמה ילדי גן חובה דרושים למחקר?
117 תרגילים: במבחן אינטליגנציה הציונים מתפלגים נורמאלית עם סטיית תקן 7 וממוצע 111. פסיכולוג מעוניין לבדוק את הטענה שבאוכלוסיות במצב סוציו אקונומי נמוך תוחלת הציונים היא 0. אם מעוניינים לגלות את הטענה בהסתברות של לפחות 00% כשרמת המובהקות היא % מהו גודל המדגם הדרוש?.1.5 משרד התקשורת טוענים שאדם מדבר בממוצע 171 דקות בחודש בטלפון הסלולרי. חברות הטלפון הסלולרי טוענות שאינפורמציה זו אינה נכונה ואדם מדבר בממוצע פחות : כ- 131 דקות. לצורך פתרון נניח שסטיית התקן של זמן השיחה החודשי ידוע ושווה ל- 31 דקות. כמה אנשים יש לדגום כך שאם טענת משרד התקשורת נכונה נדחה אותה בסיכוי של % )איך קוראים להסתברות זאת?( כמו כן אם טענת חברות הטלפון הסלולרית נכונה המחקר יגלה זאת בסיכוי של 01% )איך קוראים להסתברות זאת?) 0. השערות המחקר הן : H : 0 0 H : 1 1 כמו כן נתון שהמשתנה מתפלג נורמלית עם סטיית התקן ידועה מעוניינים לבצע מחקר שרמת המובהקות לא תעלה על α והסיכוי לטעות מסוג שני לא יעלה על β. הוכח שגוגל המדגם הרצוי לכך יהיה : 1 Z1 ( Z ) n 0 1
118 פתרונות : שאלה 1: 41 שאלה : 87 שאלה 3: הוכחה
119 מובהקות התוצאה ( p-value ) בבדיקת השערות על תוחלת עם שונות ידועה רקע: דרך נוספת להגיע להכרעות שלא דרך כלל הכרעה, היא דרך חישוב מובהקות התוצאה:. p v באמצעות תוצאות המדגם מחשבים את מובהקות התוצאה שמסומן ב- את רמת המובהקות החוקר קובע מראש לעומת זאת,את מובהקות התוצאה החוקר יוכל לחשב רק אחרי שיהיו לו את התוצאות. המסקנה של המחקר תקבע לפי העיקרון הבא: H 0 pv אם דוחים את p v = מובהקות התוצאה זה הסיכוי לקבלת תוצאות המדגם וקיצוני מתוצאות אלה בהנחת השערת האפס. P H 0 (לקבל את תוצאות המדגם וקיצוני) אם ההשערה היא דו צדדית : (לקבל את תוצאות המדגם וקיצוני) p = P v H 0 מובהקות התוצאה היא גם האלפא המינימלית לדחיית השערת האפס. H : 0 0 H : 1 0 H : 0 0 H : 1 0 H H 0 1 : : 0 0 השערת האפס : השערה אלטרנטיבה:. תנאים: ידועה X או מדגם מספיק גדול N.3 P ( ) H 0 X x P ( ) H 0 X x P ( X x) אם x H 0 0 P ( X x) אם x H 0 0 p-value X ~ N( 0, ) n כאשר בהנחת השערת האפס :
111 Z x x 0 n דוגמה: )פתרון בהקלטה( המשקל הממוצע של מתגייסים לצבא לפני 51 שנה היה 3 ק"ג. מחקר מעוניין לבדוק האם כיום המשקל הממוצע של מתגייסים גבוה יותר. נניח שמשקל המתגייסים מתפלג נורמאלית עם סטיית תקן של 15 ק"ג. במדגם של 13 מתגייסים התקבל משקל ממוצע של 81 ק"ג. א. מהי מובהקות התוצאה? ב. מה המסקנה אם רמת המובהקות היא % ואם רמת המובהקות היא 1%?
111 1 לפניך השערות של מחקר : H0 : 70. H : 70 תרגילים: המשתנה הנחקר מתפלג נורמלית עם סטיית תקן 51. במדגם מאותה אוכלוסייה התוצאות הבאות: התקבלו n 100 x 74 מהי מובהקות התוצאה?.1 השכר הממוצע במשק בשנת 5115 היה 7711 עם סטיית תקן 5111. במדגם שנעשה אתמול על 111 עובדים התקבל שכר ממוצע. 011 מטרת המחקר היא לבדוק האם כיום חלה עליה בשכר. עבור אילו רמות מובהקות שיבחר החוקר יוחלט שחלה עליה בשכר הממוצע במשק?.5 אדם חושד שחברת ממתקים לא עומדת בהתחייבויותיה, ומשקלו של חטיף מסוים אותו הוא קונה מדי בוקר נמוך מ 111 גרם. חברת הממתקים טוענת מצידה שהיא אכן עומדת בהתחייבויותיה. ידוע כי סטית התקן של משקל החטיף היא 15 גרם. האדם מתכוון לשקול 111 חפיסות חטיפים ולאחר מכן להגיע להחלטה. לאחר הבדיקה הוא קיבל משקל הממוצע של 07. גרם. א. רשמו את השערות המחקר..0 ב. ג. ד. מהי רמת המובהקות המינימלית עבורה דוחים את השערת האפס? מהי רמת המובהקות המקסימלית עבורה נקבל את השערת האפס? מה המסקנה ברמת מובהקות של? מכונה לחיתוך מוטות במפעל חותכת מוטות באורך שמתפלג נורמאלית עם תוחלת אליה כוונה המכונה וסטיית תקן 5 ס"מ. ביום מסוים כוונה המכונה לחתוך מוטות באורך 71 ס"מ. אחראי האיכות מעוניין לבדוק האם המכונה מכוילת. לצורך כך נדגמו מקו הייצור 13 מוטות שנחתכו אורכן הממוצע היה 71.8 ס"מ. א. מהי רמת המובהקות המינימלית עבורה נכריע שהמכונה לא מכוילת? ב. אם נוסיף עוד תצפית שערכה יהיה 75 ס"מ, כיצד הדבר ישפיע על התשובה של הסעיף הקודם? ג. הכרע ברמת מובהקות של % האם המכונה מכוילת..4
11 אם מקבלים בחישובים אלפא מינימלית value( P( קטנה מאוד, סביר להניח כי החוקר ידחה את השערת האפס בקלות. נכון? לא נכון? נמק.. בבדיקת השערות התקבל שה- p-value=0.0. מה תהיה מסקנת חוקר המשתמש ברמת מובהקות 1%? בחר בתשובה הנכונה. א. יקבל את השערת האפס בכל מקרה..3 ב. ידחה את השערת האפס מקרה. ג. ידחה את השערת האפס רק אם המבחן הנו דו צדדי. ד. לא ניתן לדעת כי אין מספיק נתונים. מובהקות התוצאה PV( ) היא גם : ( בחר בתשובה הנכונה ) א. רמת המובהקות המינימאלית לדחות השערת האפס. ב. רמת המובהקות המקסימאלית לדחיית השערת האפס. ג. רמת המובהקות שנקבעת מראש על ידי החוקר טרם קיבל את תוצאות המחקר. ד. רמת המובהקות המינימאלית לאי דחיית השערת האפס..8 לכן )בחר בתשובה בבדיקת השערות מסוימת התקבל value=0.054 p הנכונה(: א. ברמת מובהקות של 1.11 אך לא של 1.1 נדחה את H. 0 ברמת מובהקות של 1.11 ושל 1.1 לא נדחה את H. 0 ב. ברמת מובהקות של 1.1 אך לא של 1.11 נדחה את H. 0 ג. ברמת מובהקות של 1.11 ושל 1.1 נדחה את H. 0 ד..7
113 פתרונות : שאלה 1: 1.1557 שאלה : עבור כל רמת מובהקות סבירה. שאלה 3: ב. 1.113 ג. 1.113 ד. נכריע שיש עמידה בהתחייבות של החברה. שאלה 4: 1.1113 א. יקטן. ב. נכריע שאין כיול. ג. שאלה 1: נכון שאלה 6: תשובה :א שאלה 7: תשובה: א שאלה 8: תשובה: ג
114 בדיקת השערות על תוחלת )ממוצע( כאשר שונות האוכלוסייה אינה ידועה רקע: H : 0 0 H : 1 0 H : 0 0 H : 1 0 H H 0 1 : : 0 0 השערת האפס : השערה אלטרנטיבה:.8 תנאים: אינה ידועה X או מדגם מספיק גדול N.7 t x t ( n 1) 1 t x t ( n1) 1 ( n1) t x t 1 t x t ( n 1) 1 כלל ההכרעה: או : H 0 אזור הדחייה של t1, n 1 t1, n 1 t 1, n1 1, n1 t - דוחים את H 0 H 0 - דוחים את H 0 - דוחים את X t n1 0 1 S n X t n1 0 1 S n X X t 0 0 n1 1 n1 1 S n א S n חלופה לכלל הכרעה : נדחה H 0 אם מתקיים: ו t S n סטטיסטי המבחן : t x x S 0 n X X X i i nx n1 n1 i1 i1 n
115 התפלגות T: הינה התפלגות סימטרית פעמונית שהתוחלת שלה היא 1. ההתפלגות דומה להתפלגות Z רק שהיא יותר רחבה ולכן הערכים שלה יהיו יותר גבוהים. התפלגות T תלויה במושג שנקרא דרגות חופש. דרגות החופש הן.df=n-1 ככל שדרגות החופש עולות ההתפלגות הופכת להיות יותר גבוהה וצרה. כשדרגות החופש שואפות לאינסוף התפלגות T שואפת להיות כמו התפלגות Z. דוגמה: )פתרון בהקלטה( מפעל קיבל הזמנה לייצור משטחים בעובי של 1.1 ס"מ. כדי לבדוק האם המפעל עומד בדרישה נדגמו 11 משטחים ונמצא שהעובי הממוצע הוא 1.114 עם אומדן לסטיית תקן 1.115 ס"מ. א. מהן השערות המחקר? ב. מה ההנחה הדרושה לצורך פתרון? ג. בדוק ברמת מובהקות של %.
116 תרגילים: משך זמן ההחלמה בלקיחת אנטיביוטיקה מסוימת הוא 151 שעות בממוצע עם סטיית תקן לא ידועה. מעוניינים לבדוק האם אנטיביוטיקה אחרת מקטינה את משך זמן ההחלמה. במדגם של חולים שלקחו את האנטיביוטיקה האחרת התקבלו זמני ההחלמה הבאים: 01,0,111,71,15 שעות. מה מסקנתכם ברמת מובהקות של %. מהי ההנחה הדרושה לצורך הפתרון?.1 משרד הבריאות פרסם שמשקל ממוצע של תינוקות ביום היוולדם בישראל 0011 גר'. משרד הבריאות רוצה לחקור את הטענה שנשים מעשנות בזמן ההיריון יולדות תינוקות במשקל נמוך מהממוצע. במחקר השתתפו 51 נשים מעשנות בהריון. להלן תוצאות המדגם שבדק את המשקל של התינוקות בעת הלידה: n 0 x 310 S 80.5 מה מסקנתכם ברמת מובהקות של % מה יש להניח לצורך פתרון? ציוני מבחן אינטליגנציה מתפלגים נורמלית. בארה"ב ממוצע הציונים הוא 111. במדגם שנעשה על 50 נבחנים ישראלים, התקבל ממוצע ציונים 114. וסטיית התקן המדגמית 13.האם בישראל ממוצע הציונים שונה מבארה"ב? הסיקו ברמת מובהקות של %..0 באוכלוסייה מסוימת נדגמו 11 תצפיות והתקבלו התוצאות הבאות: 10 Xi 750 i1 10 ( Xi X) 900 i1 נתון שההתפלגות היא נורמלית. בדוק ברמת מובהקות של % האם התוחלת של ההתפלגות שונה מ- 71..4
117 ליאור ורוני העלו את אותן השערות על ממוצע האוכלוסייה. כמו כן הם התבססו על אותן תוצאות של מדגם. ליאור השתמש בטבלה של התפלגות רוני השתמשה בטבלה של התפלגות. Z. t מה נוכל לומר בנוגע להחלטת המחקר שלהם? בחר בתשובה הנכונה. א. אם ליאור ידחה את השערת האפס אז גם בהכרח רוני. ב. אם רוני תדחה את השערת האפס אז גם בהכרח ליאור. ג. שני החוקרים בהכרח יגיעו לאותה מסקנה. ד. לא ניתן לדעת על היחס בין דחיית השערת האפס של שני החוקרים.. נתון ש X N(, ) H : 0 0 H : 0 0 כמו כן נתונות ההשערות הבאות :.3 חוקר בדק את ההשערות הללו על סמך מדגם שכלל 11 תצפיות. לא הייתה ידועה לחוקר. החוקר החליט לדחות את השערת האפס ברמת מובהקות של % לאחר מכן כדי לחזק את קביעתו הוא דגם עוד תצפיות ושקלל את תוצאות אלה גם למדגם כך שכלל עכשיו 1 תצפיות. בחר בתשובה הנכונה: א. כעת בברור הוא ידחה את השערת האפס. ב. כעת הוא דווקא יקבל את השערת האפס. ג. כעת לא ניתן לדעת מה תהיה מסקנתו.
118 פתרונות: שאלה 1: נדחה H 0 שאלה : H 0 נדחה שאלה 3: H 0 נקבל שאלה 4: H 0 נקבל שאלה 1: התשובה היא : ב שאלה 6: התשובה היא : ג
119 ) בבדיקת השערות על תוחלת עם שונות אוכלוסייה לא ידועה מובהקות התוצאה ( p-value רקע: נזכיר שהמסקנה של המחקר תקבע לפי העיקרון הבא: H 0 pv אם דוחים את p v = מובהקות התוצאה זה הסיכוי לקבלת תוצאות המדגם וקיצוני מתוצאות אלה בהנחת השערת האפס. P H 0 (לקבל את תוצאות המדגם וקיצוני) אם ההשערה היא דו צדדית : (לקבל את תוצאות המדגם וקיצוני) p = P v H 0 מובהקות התוצאה היא גם האלפא המינימלית לדחיית השערת האפס. H : 0 0 H : 1 0 H : 0 0 H : 1 0 H H 0 1 : : 0 0 השערת האפס : השערה אלטרנטיבה:.0 תנאים: אינה ידועה X או מדגם מספיק גדול N.11 P ( ) H 0 X x P ( ) H 0 X x P ( X x) אם x H0 0 P ( X x) אם x H0 0 p-value t x x 0 Sˆ n n n ˆ i1 i1 S X X X i nx i n1 n1 d. f n 1
11 דוגמה : )פתרון בהקלטה( ממוצע זמן הנסיעה של אדם לעבודה הינו 41 דקות. הוא מעוניין לבדוק דרך חלופית שאמורה להיות יותר מהירה. לצורך כך הוא דוגם ימים שבהם הוא נוסע בדרך החלופית. זמני הנסיעה שקיבל בדקות הם : 58,04,05,41,01. הנח שזמן הנסיעה מתפלג נורמלית. א. רשום את השערות המחקר. ב. מצא חסמים למובהקות התוצאה. ג. מה המסקנה ברמת מובהקות של? %
11 תרגילים : קו ייצור אריזות סוכר נארזות כך שהמשקל הממוצע של אריזות הסוכר צריך להיות אחד קילוגרם. בכל יום דוגמים מקו הייצור אריזות במטרה לבדוק האם קו הייצור תקין. בבדיקה דגמו אריזות סוכר ולהלן משקלן בגרמים: 1117,1154,003,111,008 א. רשמו את השערות המחקר. ב. מהי מובהקות התוצאה? הצג חסמים. ג. מה המסקנה ברמת מובהקות של %?.1 חוקר בדק את הטענה כי פועלים העובדים במשמרת לילה איטיים יותר מפועלים העובדים ביום. ידוע כי משך הזמן הממוצע הדרוש לייצר מוצר מסוים ביום הוא 3 שעות. במדגם מיקרי של 5 פועלים שעבדו במשמרת לילה נמצא כי הזמן הממוצע לייצר אותו מוצר הוא 8 שעות עם סטית תקן של 0 שעות. מהי ה- המינימלית שלפיה ניתן להחליט שאכן העובדים במשמרת לילה איטיים יותר?.5 הגובה של מתגייסים לצה"ל מתפלג נורמלית. במדגם של 5 מתגייסים מדדו את הגבהים שלהם בס"מ והתקבלו התוצאות הבאות: x 176. ( x x) 83 i מטרת המחקר היא לבדוק האם תוחלת הגבהים של המתגייסים גבוה מ- 184 ס"מ באופן מובהק. מהי בקרוב מובהקות התוצאה ועל פיה מה תהיה המסקנה ברמת מובהקות של? 3%.0
1 פתרונות : שאלה 3: H 0 נקבל
13 הקשר בין רווח סמך לבדיקת השערות על תוחלת רקע: ניתן לבצע בדיקת השערות דו צדדית ברמת מובהקות על µ: H H 0 1 : : 0 0 על ידי בניית רווח סמך ברמת סמך של 1 ל µ: H 0 0 אם נופל ברווח נקבל את H 0 0 אם לא נופל ברווח נדחה את דוגמה: )פתרון בהקלטה( חוקר ביצע בדיקת השערות לתוחלת. להלן השערותיו: H 0 : 80 H 1: 80 5%. 79 החוקר בנה רווח סמך ברמה של 01% וקיבל : 84 האם אפשר לדעת מה מסקנתו, ואם כן מהי?
14 תרגילים : 0 1 חוקר רצה לבדוק את ההשערות הבאות: H H : 90 : 90 החוקר בנה רווח סמך לתוחלת ברמת סמך של 0% וקיבל את רווח הסמך הבא: אם החוקר מעוניין לבצע בדיקת השערות ברמת מובהקות של 1% האם ניתן להגיע למסקנה ע"ס רווח הסמך? נמקו.. (87,97).1 חוקר מעוניין לבדוק השפעת דיאטה חדשה על רמת הסוכר בדם. ידוע כי מספר מיליגרם הסוכר בסמ"ק דם הוא משתנה מקרי שמתפלג נורמלית עם סטיית תקן 11.4 מ"ג. נלקח מדגם של 31 נבדקים שניזונו מדיאטה זו. נמצא כי ממוצע מספר המיליגרם סוכר היה 11. מ"ג לסמ"ק. א. בנה רווח סמך ברמת סמך 0% לתוחלת רמת הסוכר בדם אצל הניזונים מדיאטה זו. ב. ידוע שתוחלת רמת הסוכר בדם באוכלוסיה היא 01 מ"ג לסמ"ק. האם לדעתך ניתן להסיק על סמך תוצאת סעיף א שהדיאטה משפיעה על רמת הסוכר בדם? הסבר..5 יצרן אנטיביוטיקה רושם על גבי התרופות שכמות הפנצלין היא 511 מ"ג לקפסולה. משרד הבריאות ביצע מדגם של 7 קפסולות אקראיות מקו הייצור ומצא שבממוצע יש 103 מ"ג פנצילין לקפסולה עם סטיית תקן מדגמית של של מ"ג. בהנחה וכמות הפנצלין בקפסולה מתפלגת נורמלית. א. בנה רווח סמך ברמת סמך של 0% לממוצע כמות הפנצלין לקפסולה המיוצרת על ידי יצרן האנטיביוטיקה. ב. בדוק ברמת מובהקות של % האם יש אמת באינפורמציה המסופקת על ידי היצרן..0
15 פתרונות : H 0 שאלה 1: 1. נקבל השערת שאלה : 11. 87 118. א. 13 ב. נכריע שהדיאטה משפיעה על תוחלת רמת הסוכר בדם. שאלה 3: 191. 8 00. א. ב. נכריע שיש אמת בפרסום.
16 רקע: פרק - 1 בדיקת השערות על פרופורציה התהליך H : p p 0 0 H : p p 1 0 Z pˆ Z 1 H : p p 0 0 H : p p 1 0 Z p ˆ Z1 H H 0 1 : p p : p p 0 0 ˆ p Z או 0 0 np 5& n(1 p ) 5 Z p ˆ Z Z 1 1 השערת האפס : השערה אלטרנטיבית: תנאים: כלל ההכרעה: אזור הדחייה של : H 0 Z1 - דוחים את Z1 H 0 - דוחים את Z Z 1 1 H 0 - דוחים את סטטיסטי המבחן : pˆ p 0 Z p ˆ p0 1 p0 n חלופה אחרת לכלל הכרעה: pˆ p 0 Z 1 p 0 1 p n 0 pˆ p 0 Z 1 p 0 1 p n 0 pˆ p 0 Z 1 / pˆ p0 Z1 / כלל ההכרעה: אזור הדחייה של או p p 0 0 1 p n 1 p n 0 0 H 0
17 דוגמה: )פתרון בהקלטה( בחודש ינואר השנה פורסם שאחוז האבטלה במשק הוא 7% במדגם עכשווי התקבל שמתוך 511 אנשים 3.% מובטלים. בדקו ברמת מובהקות של % האם כיום אחוז האבטלה הוא כמו בתחילת השנה.
18 תרגילים: במשך שנים אחוז המועמדים שהתקבל לפקולטה מסוימת היה 5%. השנה מתוך מדגם של 151 מועמדים התקבלו 55. ברמת מובהקות של % האם השנה הקשו על תנאי הקבלה?.1 במדגם של 011 אזרחים 8% מתנגדים להצעת חוק מסוימת. לאור נתונים אלה האם רוב האזרחים מתנגדים להצעת החוק? בדקו ברמת מובהקות של 11%..5 0. הטילו מטבע 1 פעמים וקיבלו 57 פעמים עץ. האם המטבע הוגן ברמת מובהקות של %? קפיטריה במכללה מסוימת מעריכה כי אחוז הסטודנטים שקונים קפה בקפיטריה הינו 51%. נערך סקר אשר כלל 511 סטודנטים. התברר כי 00 מהם רוכשים קפה בקפיטריה. מטרת הסקר הייתה לבדוק את אמיתות הערכה של הקפיטריה. א. רשמו את ההשערות. ב. בדוק את ההשערות ברמת מובהקות של 11%. ג. מה תהיה המסקנה אם נקטין את רמת המובהקות?.4 חבר כנסת רוצה להעביר חוק. לצורך כך הוא דוגם 411 אזרחים במטרה לבדוק האם רוב האזרחים תומכים בחוק. במדגם התקבל ש- 583 אזרחים תומכים בחוק. א. מה מסקנתכם ברמת מובהקות של %? ב. האם ניתן לדעת מה תהיה המסקנה אם רמת המובהקות תהיה גדולה יותר? הסבירו.. שני חוקרים בדקו את ההשערות הבאות: H :p p 0 0 H :p p 1 0 חוקר א השתמש ברמת מובהקות 1 וחוקר ב ברמת מובהקות החוקר הראשון דחה את.3 H 0 H 0 ואילו החוקר השני קיבל את בחר בתשובה הנכונה: א.. שניהם התבססו על אותם תוצאות של מדגם. 1 1 1 ב. ג. ד. המצב המתואר לא אפשרי.
19 פתרונות : שאלה 1: H 0 נדחה שאלה : H 0 נדחה שאלה 3: H 0 נקבל שאלה 4: ב. נקבל H 0 ג. המסקנה לא תשתנה. שאלה 1: H 0 א. נדחה ב. המסקנה לא תשתנה. שאלה 6: התשובה היא : ג.
131 רקע: סיכוי לטעויות ועוצמה הכרעה מציאות H0 H1 טעות מסוג 1 אין טעות H0 אין טעות טעות מסוג 5 H1 נגדיר את ההסתברויות הבאות: הסיכוי לבצע טעות מסוג ( 1 רמת מובהקות (: נכונה לדחות את α=p)h 0 H 0 (= הסיכוי לבצע טעות מסוג : β נכונה לקבל את =P)H 0 H 1 (= )1-α( נכונה לקבל את =P)H 0 H 0 (= רמת בטחון: π=)1-β ( נכונה לדחות את =P)H 0 H 1 ( = עוצמה :
131 התהליך לחישוב סיכוי לטעות מסוג שני: H : p p 0 0 H : p p 1 0 H : p p 0 0 H : p p 1 0 H H 0 1 : p p : p p 0 0 0 0 np 5& n(1 p ) 5 השערת האפס : השערה אלטרנטיבית: תנאים: pˆ p0 Z1 p0 1 p0 n pˆ p Z 0 1 p0 1 p0 n pˆ p Z 0 pˆ p Z 0 1 / 1 / כלל ההכרעה: אזור הדחייה של או p0 1 p0 n p0 1 p0 n H 0 P pˆ p Z 0 0 ( ) H 0 1 1 p 1 p n P pˆ p Z 0 0 ( ) H 0 1 1 p 1 p n 1 1 p p p p P ( p Z pˆ p Z ) 0 0 0 0 H 0 0 1 1 1 n n חישוב : β ˆ p(1 p) P ~ N ( p, ) n כאשר : Z pˆ pˆ p p 1 p n והתקנון:
13 דוגמה: )פתרון בהקלטה( רופאי שיניים טוענים שיותר ממחצית האוכלוסייה הבוגרת בארץ אינם מבקרים אצל רופא שיניים באופן קבוע, כנדרש. כדי לבדוק טענה זו, נערך סקר בקרב 11 אנשים בוגרים. א. רשמו את ההשערות וכלל הכרעה ברמת מובהקות של 11%. ב. מהי עוצמת המבחן אם מסתבר ש 31% מהאוכלוסייה אינם מבקרים אצל רופא שיניים באופן קבוע.
133 תרגילים: משרד הבריאות פרסם ש 11% מתושבי המדינה סובלים ממחלת האסטמה. מחקר דורש לבדוק האם בחיפה, בגלל זיהום האוויר, שיעור הסובלים מאסטמה גבוה יותר. לצורך המחקר נבדקו 531 מתושבי חיפה. א. רשמו את השערות המחקר, וצרו מבחן ברמת מובהקות של % לבדיקתן. ב. מהי עצמת המבחן של סעיף א' בהנחה ובחיפה 13% מהתושבים סובלים מאסטמה? ג. כיצד תשנה התשובה לסעיף ב' אם מסתבר שבחיפה 17% סובלים מאסטמה? ד. בהמשך לסעיף א' האם נכון לומר שבהסתברות של % ההשערה שבחיפה 11% מהתושבים סובלים מאסטמה אינה נכונה? אחוז הסובלים מתופעות הלוואי מתרופה מסוימת הוא 1%. חברת תרופות טוענת שפיתחה תרופה שאמורה לצמצם את אחוז הסובלים מתופעות לוואי. לצורך בדיקת הטענה הוחלט לבצע מחקר שיכלול 151 חולים שיקבלו את התרופה הנבדקת. א. נניח שהתרופה נבדקת אכן מורידה את פרופורציות הסובלים מתופעות הלוואי ל- 11% מהי עצמת המבחן עבור רמת מובהקות של %?.1.5 בעיר מסוימת היו 51% אקדמאים. בעקבות פתיחת מכללה בעיר לפני כמה שנים מעוניינים לבדוק האם אחוז האקדמאים גדל. מעוניינים שהמחקר יכלול 511 אנשים והוא יהיה ברמת מובהקות של %. א. חשבו את הסיכוי לבצע טעות מסוג שני בהנחה והיום יש 57% אקדמאים. ב. כיצד התשובה לסעיף הקודם תשתנה אם נגדיל את רמת המובהקות?.0 מעוניינים לבדוק האם בפקולטה מסוימת ישנה העדפה לגברים. הוחלט לדגום 511 מתקבלים ועל סמך מספר הבנים לקבוע אם טענת המחקר מתקבלת. חוקר א' קבע רמת מובהקות של % וחוקר ב' החליט לקבל את טענת המחקר אם במדגם יהיו לפחות 151 בנים. למי מבין החוקרים רמת מובהקות גדולה יותר?.4 חוקר ביצע מחקר ובו עשה טעות מסוג שני לכן ( בחר בתשובה הנכונה ) א. השערת האפס נכונה. ב. השערת האפס נדחתה. ג. השערת האפס לא נדחתה. ד. אף אחת מהתושבות לא נכונה בהכרח.. 3. קבע אם הטענה הבאה נכונה: "בבדיקת השערות לא ניתן לבצע בו זמנית טעות מסוג ראשון וטעות מסוג שני"
134 שאלה 1: ב. 1.011 ג. תגדל ד. טענה לא נכונה. פתרונות: שאלה : 1.4414 שאלה 3: א. 1.1443 ב. תקטן. שאלה 4: חוקר א. שאלה 1: התשובה הנכונה היא ג. שאלה 6: נכונה.
135 רקע: קביעת גודל מדגם H : p p 0 0 H : p p 1 1 השערות המחקר הן : מעוניינים לבצע מחקר שרמת המובהקות לא תעלה על α והסיכוי לטעות מסוג שני לא יעלה על β. הנוסחה הבאה נותנת את גודל המדגם הרצוי : Z1 p0q0 Z1 p1q 1 n p0 p 1 דוגמה: )פתרון בהקלטה( רוצים לבדוק האם אחוז האנשים השוהים בשמש ללא הגנה ירד בעקבות הפרסומת על נזקי השמש. בעבר 31% מהאוכלוסייה שהתה בשמש ללא הגנה. מה גודל המדגם המינימלי שיש לקחת כדי לבדוק שהאחוז הנ"ל ירד ל 47% אם מעוניינים שהסיכוי לטעות מסוג ראשון יהיה % והסיכוי לטעות מסוג שני יהיה 1%?
136 תרגילים: משרד התמ"ת פרסם שאחוז האבטלה במשק היום עומד על 7%. לעומתו, משרד הפנים טוען שחלה עלייה בשיעור האבטלה עד לכדי 11%. כדי לבדוק מי מבניהם צודק, מה צריך להיות גודל המדגם שיענה על שני התנאים הבאים: אם משרד התמ"ת צודק, נדחה את טענתו בסיכוי של 11%. אם משרד הפנים צודק, נדחה את טענתו בסיכוי של 4%..1 מפעיל קזינו מפרסם שהסיכוי לזכות במכונת מזל הינו 1.45. אדם טוען שהסיכויים לזכות במשחק נמוכים יותר. כמה פעמים יש לשחק את המשחק כדי שאם טענת מפעיל הקזינו נכונה נקבל את טענת האדם בסיכוי של 1% ואם במציאות הסיכוי לזכות במכונה הוא 1.0 נקבל את מפעיל הקזינו בסיכוי של 7%..5
137 פתרונות: שאלה 1: 701 שאלה : 554
138 מובהקות התוצאה רקע: דרך נוספת להגיע להכרעות שלא דרך כלל הכרעה, היא דרך חישוב מובהקות התוצאה:. p v באמצעות תוצאות המדגם מחשבים את מובהקות התוצאה שמסומן ב- את רמת המובהקות החוקר קובע מראש לעומת זאת,את מובהקות התוצאה החוקר יוכל לחשב רק אחרי שיהיו לו את התוצאות. המסקנה של המחקר תקבע לפי העיקרון הבא: H 0 pv אם דוחים את p v = מובהקות התוצאה זה הסיכוי לקבלת תוצאות המדגם וקיצוני מתוצאות אלה בהנחת השערת האפס. P H 0 (לקבל את תוצאות המדגם וקיצוני) אם ההשערה היא דו צדדית : (לקבל את תוצאות המדגם וקיצוני) p = P v H 0 מובהקות התוצאה היא גם האלפא המינימלית לדחיית השערת האפס. H : p p 0 0 H : p p 1 0 P ( Pˆ pˆ ) H 0 H : p p 0 0 H : p p 1 0 P ( Pˆ pˆ ) H 0 H H 0 1 : p p : p p 0 0 np 5& n(1 p ) 5 0 0 P ( Pˆ pˆ) pˆ p H 0 0 P ( Pˆ pˆ) pˆ p H 0 0 השערת האפס : השערה אלטרנטיבית: תנאים: p-value אם אם p (1 p ) n ˆ ~ 0 0 N ( p0, ) P כאשר בהנחת השערת האפס : והתקנון: pˆ p 0 Z p ˆ p0 1 p0 n
139 דוגמה: )פתרון בהקלטה( ישנה טענה שיש הבדל בין אחוז הבנים ואחוז הבנות הפונים ללמוד להנדסאי מחשבים. לשם כך נלקח מדגם מקרי של 511 תלמידים הלומדים מחשבים והתברר כי 115 מהם בנים. א. מהי מובהקות התוצאה? ב. מה המסקנה ברמת מובהקות של %?
141 תרגילים: במשך שנים אחוז המועמדים שהתקבל לפקולטה מסוימת היה 5%. השנה מתוך מדגם 151 מועמדים התקבלו 55. רוצים לבדוק האם השנה הקשו על תנאי הקבלה. א. מהי מובהקות התוצאה? ב. מה תהיה המסקנה ברמת מובהקות של 1% וברמת מובהקות של %? של.1 נהוג לחשוב ש 31% מהילדים בגיל שלוש קמים מהמיטה במהלך הלילה לפחות פעם אחת. ישנה טענה שללא שנת צהריים פחות מ 31% מהילדים בגיל זה יקומו לפחות פעם אחת במהלך הלילה. נדגמו 71 ילדים בגיל 0 אשר אינם ישנים בצהריים מתוכם התקבל ש 41 קמו במהלך הלילה. א. מהי רמת המובהקות המינימלית עבורה תתקבל הטענה במחקר? ב. מהי רמת המובהקות המקסימלית עבורה לא תתקבל טענת המחקר? ג. עבור אילו רמות מובהקות נקבל את טענת המחקר? ד. מה תהיה מסקנת המחקר ברמת מובהקות של 3%?.5 במטרה לבדוק האם מטבע הוא הוגן מטילים אותו 71 פעמים. התקבל ש 31 מההטלות הראו עץ. רשמו את השערות המחקר, חשבו את מובהקות התוצאה והסיקו מסקנה ברמת מובהקות של %..0 בבדיקת השערות על פרופורציה התקבל שה- p-value=0.0. מה תהיה מסקנת חוקר המשתמש ברמת מובהקות %: ( בחר בתשובה הנכונה( א. יקבל את השערת האפס ב. ידחה את השערת האפס. ג. לא ניתן לדעת כי אין מספיק נתונים..4 קבע אם הטענה הבאה נכונה: "במבחן לבדיקת השערות חד-צדדי התקבל ערך p-value של 0% לכן אם היינו מבצעים מבחן דו-צדדי )כאשר יתר הנתונים ללא שינוי( היינו מקבלים ערך p-value של 3%". 3. במפעל 11% מהעובדים נפגעים לפחות פעם אחת בשנה מתאונות עבודה. לאור זאת, המפעל החליט לצאת בתוכנית לצמצום שיעור הנפגעים. תכנית זו נוסתה על 111 עובדים. מתוכם 15 נפגעו בתאונות עבודה במשך השנה. מהי רמת המובהקות הקטנה ביותר עבורה יוחלט שהתכנית יעילה?
141 פתרונות : שאלה 1: א. 1.14 שאלה : א. 1.147 ב. 1.147 ג. מעל 1.147 ד. נכריע לטובת טענת המחקר. שאלה 3: p 0 v שאלה 4: התשובה הנכונה: ב שאלה 1: הטענה נכונה שאלה 6: 1.8473
14 H : p p 0 0 1 H : p p 0 1 1 Z pˆ pˆ Z1 1 רקע: פרק - 13 בדיקת השערות על הפרש פרופורציות H : p p 0 0 1 H : p p 0 1 1. 5 מדגמים גדולים Z pˆ pˆ Z1 1 H : p p 0 0 1 H : p p 0 1 1 השערת האפס : השערה אלטרנטיבית: תנאים: כלל ההכרעה: אזור הדחייה של : 1.מדגמים בלתי תלויים Z או pˆ1 pˆ Z pˆ1 pˆ Z 1 Z 1 Z1 - דוחים את H 0 Z1 H 0 - דוחים את Z Z 1 1 H 0 - דוחים את y y n pˆ n pˆ ˆp n n n n 1 1 1 1 1 סטטיסטי המבחן : Z p 1ˆ כאשר הפרופורציה המשוקללת: p ˆ p ˆ1 ˆ p H 0 pq ˆ ˆ pq ˆ ˆ n n 1 חלופה אחרת לכלל הכרעה: pq ˆˆ pq ˆ ˆ pˆ ˆ 1 p 0 Z1 n n 1 pq ˆ ˆ pˆ qˆ pˆ ˆ 1 p 0 Z1 n n 1 pˆ qˆ pˆ qˆ pˆ ˆ 1 p 0 Z1 / n n 1 כלל ההכרעה: אזור הדחייה של או pq ˆˆ pq ˆ ˆ pˆ1 pˆ 0 Z1 / n n 1 H 0 p q p q 1 1 pˆ1 pˆ N( p1 p, ) n1 n Z Z pˆ1 pˆ pˆ1 pˆ H 0 pˆ1 pˆ ( p1 p) pˆ ˆ ˆ ˆ 1q1 pq n n 1 pˆ ˆ 1 p pq ˆ ˆ pq ˆ ˆ n n 1 : pˆ pˆ התפלגות של : 1 תקנון:
143 דוגמה: )פתרון בהקלטה( נדגמו 71 סטודנטים שנבחנו במיקרו-כלכלה. מתוכם 31 עברו את הבחינה. נדגמו 111 סטודנטים שנבחנו בסטטיסטיקה א'. מתוכם 75 עברו את הבחינה. האם שיעור העוברים את הבחינה בסטטיסטיקה גבוה מאשר מהבחינה במיקרו כלכלה? בדקו ברמת מבוהקות של 11%.
144 תרגילים: במדגם של 511 גברים. 7% מהם היו מובטלים. המדגם של 171 נשים 11% מהן היו מובטלות האם קיים הבדל מובהק בין פרופורציית המובטלים לפרופורציית המובטלות. בדוק ברמת מובהקות של %..1 אחוז בעלי רישיון נהיגה בקרב האוכלוסייה הבוגרת הינו 31%. במדגם של 011 בוגרים מתל אביב 514 היו בעלי רישיון נהיגה. במדגם של 551 בוגרים מירושלים 111 היו בעלי רישיון נהיגה. א. ברמת מובהקות של % האם תקבלו את הטענה שאחוז בעלי הרישיון בתל אביב גבוה מהאחוז הארצי? ב. ברמת מובהקות של 11% האם תקבלו את הטענה שאחוז בעלי הרישיון נהיגה בתל אביב גבוה מאחוז בעלי רישיון הנהיגה בירושלים?.5 נדגמו 11 בוגרים מתוכם 511 גברים והיתר נשים. במדגם התקבל : מתוך הגברים ל- 47% תעודת בגרות. מתוך הנשים ל- 7% תעודת בגרות. מטרת המחקר היא לבדוק האם שיעור הזכאיות לבגרות גבוה משיעור הזכאים. א. מהי מובהקות התוצאה? ב. מה תהיה המסקנה ברמת מובהקות של 7%?.0 במדגם שנערך על 111 פרות מחוות בדרום הארץ התקבל כי 51 פרות נושאות וירוס מסוים. במדגם שנערך על 511 פרות מחוות בצפון הארץ התקבל כי 11 מתוכן נושאות וירוס גם כן. א. בנו מבחן ברמת מובהקות של % לבדיקת הטענה כי הווירוס תקף את פרות הדרום באופן משמעותי יותר מאשר את הפרות בצפון הארץ. ב. מהי המסקנה לבדיקת הטענה של סעיף א ומהי הטעות האפשרית במסקנה? ג. מהי עוצמת המבחן אם שיעור הפרות בדרום עם הווירוס גבוה ב 11% משיעור הפרות בצפון עם הווירוס? ד. כיצד העוצמה תשתנה אם נגדיל את רמת המובהקות?.4 פתרונות :
145 שאלה 1: לא נדחה את H 0 שאלה : H 0 א. נדחה ב. נדחה H 0 שאלה 3: א. 1.1100 H 0 ב. נדחה שאלה 4: ב. נדחה ג. 1.7507 ד. תגדל H 0
146 פרק - 18 בדיקת השערות על הפרש תוחלות במדגמים בלתי תלויים H H c 0 1 c 1 1 H H 0 1 1 1 רקע: השערת האפס : השערה אלטרנטיבית: כשהשונויות של האוכלוסייה ידועות c c H H c 0 1 c 1 1.1 תנאים: מדגמים בלתי תלויים 1 ידועות,.5 X, X N 1.0 או מדגמים מספיק גדולים Z x 1 x Z 1 Z x 1 x Z 1 Z Z x 1 x 1 Z Z x 1 x 1 כלל ההכרעה: או : H 0 אזור הדחייה של H 0 Z1 - דוחים את Z1 H 0 - דוחים את Z 1 1 H 0 Z - דוחים את סטטיסטי המבחן : x1x c Z x1 x 1 n n 1 חלופה אחרת לכלל הכרעה: 1 x1 x c Z1 n n 1 1 x1 x c Z1 n n 1 1 x1 x c Z1 / n n 1 נדחה H 0 אם מתקיים: או 1 x1 x c Z1 / n n 1 התפלגות הפרש הממוצעים : 1 x1 x ~ N( 1, ) n1 n התקנון : Z x1 x x x ( ) 1 1 n n 1 1
147 דוגמה : )פתרון בהקלטה( בשנת 5114 הפער בין השכר הממוצע של הגברים לנשים היה 0111 לטובת הגברים. מעוניינים לבדוק האם כיום הצטמצם הפער בין הגברים לנשים מבחינת השכר הממוצע. נדגמו 111 עובדים גברים. שכרם הממוצע היה. 0,185 נדגמו 71 עובדות, שכרן הממוצע היה. 8710 לצורך פתרון נניח שסטיות התקן של השכר ידועות ושוות ל- 5111 באוכלוסיית הנשים ו- 0111 באוכלוסיית הגברים. מה המסקנה ברמת מבוהקות של %?
148 תרגילים : מחקר טוען שאנשים החיים במרכז הארץ צופים בממוצע בטלוויזיה יותר מאנשים שלא חיים במרכז. נדגמו 111 אנשים מהמרכז ו- 118 אנשים לא מהמרכז. אנשים אלו נשאלו כמה שעות ביום הם נוהגים לצפות בטלוויזיה. במדגם של מרכז הארץ התקבל ממוצע 5.8 שעות. במדגם של מחוץ למרכז הארץ התקבל ממוצע 1.7 שעות. לצורך פתרון הניחו שבכל אזור, סטיית התקן היא שעה 1 ביום. בדקו את טענת המחקר ברמת מובהקות של 1%..1 ציוני פסיכומטרי מתפלגים נורמלית עם סטיית תקן 111. מכון ללימוד פסיכומטרי טוען שהוא יכול לשפר את ממוצע הציונים ביותר מ- 01 נקודות. במדגם של 51 נבחנים שניגשו למבחן ללא הכנה במכון התקבל ממוצע 17. במדגם של 5 נבחנים שעברו הכנה במכון התקבל ממוצע ציונים 31. מה מסקנתכם ברמת מובהקות של %..5 במדגם אקראי של 51 ימים נבדקה התפוקה של מפעל ביום. התפוקה הממוצעת הייתה של 041 מוצרים ליום. במדגם אקראי של 51 ימים אחרים נבדקה התפוקה של המפעל בלילה והתפוקה הממוצעת הייתה 50. לצורך פתרון נניח שסטיית התקן של התפוקה ביום היא 41 מוצרים ובלילה 01 מוצרים. א. מהי מובהקות התוצאה לבדיקה האם התפוקה הממוצעת היומית גבוהה מהתפוקה הממוצעת הלילית. ב. מה תהיה המסקנה ברמת מובהקות של 7%?.0 במחקר מקיף שנעשה באירופה נקבע שגברים גבוהים מנשים ב- 7 ס"מ בממוצע. מחקר ישראלי מתעניין לבדוק האם בישראל הפער גדול יותר. לצורך המחקר נדגמו 41 גברים ו 41 נשים באקראי. כמו כן, נניח שסטיות התקן של הגברים והנשים ידועות ושוות ל- 3 ס"מ אצל הנשים. ו- 15 ס"מ אצל הגברים. א. מהן השערות המחקר ומהו כלל ההכרעה ברמת מובהקות של 11%? ב. אם בישראל הפער בין גברים לנשים מבחינת הגובה הממוצע הוא 11 ס"מ, מה ההסתברות שהמחקר לא יגלה זאת? איך קוראים להסתברות הזאת?.4
149 פתרונות: שאלה 1: נדחה H 0 H 0 שאלה : לא נדחה את שאלה 3: א. 1 H 0 ב. נדחה שאלה 4: א. נדחה ב. 1.3001 H 0 אם במדגם הגברים יהיו גבוהים בממוצע מהנשים ביותר מ- 11.85 ס"מ.
151 H H c 0 1 c 1 1 רקע: השערת האפס : השערה אלטרנטיבית: תנאים: כששונויות האוכלוסיה לא ידועות ומניחים שהן שוות H H c 0 1 c 1 1 H H c 0 1 c 1 1 מדגמים בלתי תלויים 4. 1 לא ידועות אך שוות,. המשתנים בכל אוכלוסייה מתפלגים נורמלית.3 t x x 1 t ( n1 n ) 1 t x x 1 t ( n1 n ) 1 t x x 1 t ( n1 n ) 1 : H 0 אזור הדחייה של או t x x 1 t ( n1 n 1 ) t 1, n1 n - דוחים את H 0 t 1, n1 n H 0 - דוחים את t 1, n1 n 1, n1 n H 0 t - דוחים את סטטיסטי המבחן : S 1 1 n S n S 1 1 p n1n t השונות המשוקללת : x x 1 1 x x c S S n p p n 1 חלופה אחרת לכלל הכרעה: p p ( n1n) S S x1 x c t1 n n 1 p p ( n1n) S S x1 x c t1 n n 1 ( 1 ) 1 p p n n S S x1 x c t n n 1 נדחה H 0 מתקיים: אם או ( 1 ) 1 p p n n S S x1 x c t n n 1
151 דוגמה : )פתרון בהקלטה( חברה המייצרת מוצרי בנייה טוענת שפיתחה סגסוגת )תערובת מתכות( שטמפרטורת ההתכה שלה גבוהה משמעותית מטמפרטורת ההתכה של הסגסוגת לבנייה שמשתמשים בה כיום לבניית בניינים. לצורך בדיקת טענת המחקר נדגמו 11 יחידות של מתכות מהסוג הישן ו- 15 יחידות של מתכות מהסוג החדש. להלן תוצאות המדגם: טמפרטורת ההתכה הממוצעת במתכת הישנה 1181 מעלות עם אומד חסר הטיה לשונות. S 00 טמפרטורת ההתכה הממוצעת במתכת החדשה 1018 מעלות עם אומד חסר הטיה לשונות. S 60 נניח לצורך פתרון שטמפרטורת ההתכה מתפלגת נורמאלית עם אותה שונות במתכות השונות. בדקו ברמת מובהקות של %.
15 תרגילים: 1. להלן נתונים של שטחי דירות מתוך דירות שנבנו בשנת 5115 ובשנת 5110 )מטרים רבועים(: 151 04 01 101 0 115 151 01 30 84 11 01 75 111 013 בדקו שבשנת 5110 הייתה ירידה משמעותית בשטחי הדירות לעומת שנת 5115 עבור רמת מובהקות של %.הניחו ששטחי הדירות בכל שנה מתפלגים נורמלית עם אותה שונות. נדגמו 1 ישראלים ו- 1 אמריקאים. כל הנדגמים נגשו למבחן.IQ להלן תוצאות המדגם:.5 המדינה גודל המדגם סכום הציונים סכום ריבועי הציונים ישראל 1 131 13,001 ארה"ב 1 1481 148,31 בדקו ברמת מובהקות של % האם קיים הבדל של נקודה בין ישראלים לאמריקאים מבחינת ממוצע הציונים במבחן ה- IQ לטובת ישראל. רשמו את כל ההנחות הדרושות לצורך פתרון התרגיל. להלן תוצאות מדגם הבדק אורך חיים של נורות מסוג W31 ומסוג W111. אורך החיים נמדד בשעות..0 1-111W 03 85 1 5-31W 1118 71 10 הקבוצה x S n א. בדקו ברמת מובהקות של % האם נורות מסוג W31 דולקות בממוצע יותר מאשר נורות מסוג W111. רשמו את כל ההנחות הדרושות לפתרון. ב. עבור איזו רמת מובהקות ניתן לקבוע שנורות מסוג Wדולקות 31 בממוצע יותר מאשר נורות מסוג W? 111 ג. בדקו ברמת מובהקות של % האם נורות מסוג W 31 דולקות יותר מ 1111 שעות. רשמו את כל ההנחות הדרושות. פתרונות :
153 H 0 שאלה 1: לא נדחה שאלה : שאלה 3: א. נדחה H 0 ב. רמות מובהקות של לפחות % ג. לא נדחה H 0
154 פרק - 17 רקע: בדיקת השערות על תוחלת ההפרשים במדגמים מזווגים )תלויים( בדיקת השערות למדגמים מזווגים H H 0 1 : : C D C D H H 0 1 : : C D C D H H 0 1 : : C D C D השערת האפס : השערה אלטרנטיבית: D.8 תנאים: אינה ידועה D או מדגם מספיק גדול N.7 td ( n1) t1 td ( n1) t1 td ( n1) t 1 td ( n1) t 1 כלל ההכרעה: או : H 0 אזור הדחייה של t1, n 1 t1, n 1 t 1, n1 1, n1 t - דוחים את H 0 H 0 - דוחים את H 0 - דוחים את D C t n1 1 SD n D C t n1 1 SD n D C t n1 1 S D n א חלופה לכלל הכרעה : נדחה H 0 אם מתקיים: ו D C t n1 1 S D n סטטיסטי המבחן : t D D D SD n S n D D D i nd i i1 i1 D n1 n1 n
155 דוגמה: )פתרון בהקלטה) חברה שיווקית מעוניינת לבדוק את טענת רשת השיווק "מגה בעיר" הטוענת שמחיריה נמוכים מהמחירים מרשת השיווק "שופרסל". לצורך בדיקה נבחרו באקראי 4 מוצרים שונים. המחירים נבדקו בשתי הרשתות. להלן המחירים: שופרסל מגה בעיר המוצר 17 18 שמפו 8 47 ג'ל כביסה 0 0 עוגת גבינה 11 15 לחם 48 40 קפה נמס 145 110 בקבוק יין 53 51 גבינה בולגרית בהנחה והמחירים מתפלגים נורמאלית בדקו ברמת מובהקות של % את טענת רשת "מגה בעיר".
156 תרגילים: מבחינת המחירים לשיחות בינ"ל. לחברת Y X במטרה לבדוק האם קיים הבדל בין חברת נגדמו באקראי 8 מדינות ועבור כל מדינה נבדקה עלות דקת שיחה. להלן התוצאות: Y X המדינה 1.4 1. ארה"ב 5 5.1 קנדה 1.0 5.5 הולנד 0.1 0 פולין 0.5 0. מצרים 0.5 0.5 סין 4.5 4.5 יפן.1 בהנחה והמחירים מתפלגים נורמלית בכל חברה, בדקו ברמת מובהקות של % קיים הבדל בין החברות מבחינת המחירים בממוצע? האם מכון המכין לפסיכומטרי טוען שהוא מעלה את ממוצע הציונים ביותר מ- 01 נקודות. 7 נבחנים נבדקו לפני ואחרי שהם למדו במכון. להלן התוצאות שהתקבלו:.5 01 71 11 51 001 11 381 371 341 311 451 401 481 41 13 81 לפני אחרי מה מסקנתכם ברמת מובהקות %? הניחו שציוני פסיכומטרי מתפלג נורמלית.
157 נדגמו סטודנטים שסיימו את הקורס סטטיסטיקה ב'. להלן הציונים שלהם בסמסטר א' ו- ב': סטטיסטיקה ב סטטיסטיקה א 71 84 74 37 78 01 83 8 111 75.0 פורסם שתלמידים שמסיימים את סמסטר ב משפרים בממוצע את הציונים ב- נקודות לעומת סמסטר א'. הנח שהציונים מתפלגים נורמלית. א. מהי מובהקות התוצאה לבדיקת הטענה שהשיפור הוא יותר מ נקודות? ב. על סמך הסעיף הקודם, מהי רמת המובהקות המינימלית להכרעה שהשיפור הוא יותר מ- נקודות? ג. לאור זאת, מה המסקנה ברמת מובהקות של? 11% לצורך בדיקת השפעת היפנוזה על לימוד אנגלית, נבחרו 11 זוגות תאומים זהים. אחד התאומים למד אנגלית בהשפעת היפנוזה, והשני ללא היפנוזה. לאחר מכן נערך לשניהם מבחן באנגלית. נניח שציוני המבחן מתפלגים נורמאלית ללא ידיעת השונות האמתית. המבחן שיש לבצע כאן הוא: א. מבחן Z למדגם יחיד. ב. מבחן T למדגם יחיד. ג. מבחן T למדגמים בלתי תלויים. ד. מבחן T למדגמים מזווגים..4
158 בתחנת טיפת חלב מסוימת יש שני מכשירי שקילה. על מנת להשוות בין שני המשקלים נדגמו 4 תינוקות. כל תינוק בן חודשיים נשקל בכל אחד מהמשקלים. להלן תוצאות השקילה )בק"ג(:.5.. משקל במכשיר 1 3.. 8...... משקל במכשיר 5 3.0 7.1.. נניח שהמשקלים מתפלגים נורמלית. המבחן שיש לבצע כאן הוא: א. מבחן Z למדגם יחיד. ב. מבחן T למדגם יחיד. ג. מבחן T למדגמים בלתי תלויים. ד. מבחן T למדגמים מזווגים. כדי להשוות בין שני אצים נדגמו תוצאות מריצת 111 מטר של כל אצן. זמני הריצה נרשמו ויש להניח שמתפלגים נורמלית. המטרה להשוות בין האצנים. המבחן שיש לבצע כאן הוא: א. מבחן Z למדגם יחיד. ב. מבחן T למדגם יחיד. ג. מבחן T למדגמים בלתי תלויים. ד. מבחן T למדגמים מזווגים..3
159 פתרונות: שאלה 1: H 0 לא נדחה שאלה : H 0 לא נדחה שאלה 3: א. 0.5 pv 0.5 ב. 0.5 ג. לא נדחה H 0 שאלה 4: התשובה היא ד. שאלה 1: התשובה היא ד. שאלה 6: התשובה היא ג.
161 פרק - 10 הקשר בין רווח סמך לבדיקת השערות על הפרש תוחלות רקע: ניתן לבצע בדיקת השערות דו צדדית ברמת מובהקות על : 1 H : C 0 1 H : C 1 1 על ידי בניית רווח סמך ברמת סמך של 1 ל : 1 H 0 אם C נופל ברווח נקבל את H 0 אם C לא נופל ברווח נדחה את H H : 80 0 D : 80 1 D 5% דוגמה: )פתרון בהקלטה( חוקר ביצע בדיקת השערות לתוחלת ההפרש במדגם מזווג. להלן השערותיו: החוקר בנה רווח סמך ברמה של 01% 78 83 D האם אפשר לדעת מה מסקנתו, ואם כן מהי?
161 תרגילים: נדגמו סטודנטים שסיימו את הקורס סטטיסטיקה ב'. להלן ציוניהם בסמסטר א' ו- ב': סטטיסטיקה א סטטיסטיקה ב 71 84 74 37 78 01 83 8 111 75.1 א. בנו רווח סמך ברמת סמך של 0% לתוחלת פער הציונים בין סמסטר א לבין סמסטר ב. ב. פורסם שתלמידים שמסיימים את סמסטר ב משפרים בממוצע את הציונים ב- נק' לעומת סמסטר א' האם יש אמת בפרסום? הוחלט להשוות הציונים אצל מרצה X ואצל מרצה Y. נבחרו באקראי 3 סטודנטים, 0 סטודנטים של מרצה X ו 0 סטודנטים של מרצה Y, עבורם התקבלו הציונים הבאים: 37 01 75 מרצה X 34 71 37 מרצה Y.5 א. ב. חשבו רווח סמך ברמת סמך 01% להפרש בין התוחלות של הציונים אצל שני המרצים. האם ברמת מובהקות של 11% נכריע שיש הבדל בין תוחלות הציונים אצל שני המרצים? שאלות אמריקאיות: סטטיסטיקאי נתבקש לאמוד את הפרש הממוצעים של שני טיפולים לפי שני מדגמים מקריים בלתי תלויים. הוא חישב רווח סמך להפרש ברמת סמך 1.07, וקיבל את הרווח אילו יתבקש החוקר לבדוק לפי אותם נתונים את ההשערות:. 4.5 1, H : 0 ; H : 0 ברמת מובהקות 1.1 מסקנתו תהיה: 1 1 0 1 לדחות את השערת האפס. א. לא לדחות את השערת האפס. ב. שלא ניתן לדעת את המסקנה עבור רמת מובהקות. 1.1 ג. שלא נתונות בשאלה סטיות התקן של האוכלוסיות, ולכן לא ניתן להסיק דבר. ד..0
16 4. במטרה לבדוק האם קיים הבדל בין קווי זהב לבזק מבחינת ממוצע המחירים לשיחות בינ"ל. נגדמו באקראי 8 מדינות ועבור כל מדינה נבדקה עלות דקת שיחה. בהנחה והמחירים מתפלים נורמלית בנו רווח סמך לממוצע ההפרשים וקיבלו : 0.093 D 0.145 לכן מסקנת המחקר היא : א. ב. ג. רווח הסמך הוא ברמת סמך של 0%. ברמת מובהקות של % לא נוכל לקבוע שקיים הבדל בין החברות. ברמת מובהקות של % נקבע שקיים הבדל מובהק בין החברות. של D. לא ניתן לדעת מה המסקנה ברמת מובהקות של % כיוון שלא נאמר מה ההגדרה
163 פתרונות: שאלה 1: א. 3.8 19 D ב. נכריע שיש אמת בפרסום. שאלה : א. 8.5 6.5 X Y ב. נכריע שאין הבדל. שאלה 3: התשובה היא ג. שאלה 4 התשובה היא א.
164 פרק 51- בדיקת השערות על שונויות בדיקת השערות על שונות האוכלוסייה כאשר התוחלת לא ידועה רקע: H 0 : σ = σ 0 H 1 : σ > σ 0 H 0 : σ = σ 0 H 1 : σ < σ 0 H 0 : σ = σ 0 H 1 : σ σ 0 השערת האפס : השערה אלטרנטיבית: X ~ N תנאים : נדחה את השערת האפס אם: (n 1) (n 1) 1 (n 1) או (n 1) 1 0 (n 1)S ˆ סטטיסטי המבחן : (n )Sˆ 1 (n 1) 0 התפלגות חי בריבוע : i אם ), X N( והפרמטר אינו ידוע מתקיים ש: התפלגות זו היא התפלגות אסימטרית חיובית המתחילה מהערך אפס וערכיה שואפים לאינסוף. התפלגות זו תלויה בדרגות החופש. אם אינו ידוע אז: d. f n 1 דוגמה : )פתרון בהקלטה( ציוני IQ לפי סטנדרטים אמריקאים מתפלגים נורמאלית עם. 15 מעוניינים לבדוק האם שונות הציונים של נבחנים ישראלים שונה מאמריקה. במדגם של 51 ישראלים התקבל : 0.מה המסקנה ברמת מובהקות של %? i1 ( x x) 340 i
165 טבלת חי בריבוע על סמך השטח מצד ימין α df 0.995.99.975.95.90.75.50.5.10.05.05.01.005 1 0.0 4 393 0.0 3 157 0.0 3 98 0.0 393 0.0158 0.10 0.455 1.3.71 3.84 5.0 6.63 7.88 0.0100 0.001 0.0506 0.103 0.11 0.575 1.39.77 4.61 5.99 7.38 9.1 10.6 3 0.0717 0.115 0.16 0.35 0.584 1.1.37 4.11 6.5 7.81 9.35 11.3 1.8 4 0.07 0.97 0.484 0.711 1.06 1.9 3.36 5.39 7.78 9.49 11.1 13.3 14.9 5 0.41 0.554 0.831 1.15 1.61.67 4.35 6.63 9.4 11.1 1.8 15.1 16.7 6 0.676 0.87 1.4 1.64.0 3.45 5.35 7.84 10.6 1.6 14.4 16.8 18.5 7 0.989 1.4 1.69.17.83 4.5 6.35 9.04 1.0 14.1 16.0 18.5 0.3 8 1.34 1.65.18.73 3.49 5.07 7.34 10. 13.4 15.5 17.5 0.1.0 9 1.73.09.70 3.33 4.17 5.90 8.34 11.4 14.7 16.9 19.0 1.7 3.6 10.16.56 3.5 3.94 4.87 6.74 9.34 1.5 16.0 18.3 0.5 3. 5. 11.60 3.05 3.8 4.57 5.58 7.58 10.3 13.7 17.3 19.7 1.9 4.7 6.8 1 3.07 3.57 4.40 5.3 6.30 8.44 11.3 14.8 18.5 1.0 3.3 6. 8.3 13 3.57 4.11 5.01 5.89 7.04 9.30 1.3 16.0 19.8.4 4.7 7.7 9.8 14 4.07 4.66 5.63 6.57 7.79 10. 13.3 17.1 1.1 3.7 6.1 9.1 31.3 15 4.60 5.3 6.6 7.6 8.55 11.0 14.3 18..3 5.0 7.5 30.6 3.8 16 5.14 5.81 6.91 7.96 9.31 11.9 15.3 19.4 3.5 6.3 8.8 3.0 34.3 17 5.70 6.41 7.56 8.67 10.1 1.8 16.3 0.5 4.8 7.6 30. 33.4 35.7 18 6.6 7.01 8.3 9.39 10.9 13.7 17.3 1.6 6.0 8.9 31.5 34.8 37. 19 6.84 7.63 8.91 10.1 11.7 14.6 18.3.7 7. 30.1 3.9 36. 38.6 0 7.43 8.6 9.59 10.9 1.4 15.5 19.3 3.8 8.4 31.4 34. 37.6 40.0 1 8.03 8.90 10.3 11.6 13. 16.3 0.3 4.9 9.6 3.7 35.5 38.9 41.4 8.64 9.54 11.0 1.3 14.0 17. 1.3 6.0 30.8 33.9 36.8 40.3 4.8 3 9.6 10. 11.7 13.1 14.8 18.1.3 7.1 3.0 35. 38.1 41.6 44. 4 9.89 10.9 1.4 13.8 15.7 19.0 3.3 8. 33. 36.4 39.4 43.0 45.6 5 10.5 11.5 13.1 14.6 16.5 19.9 4.3 9.3 34.4 37.7 40.6 44.3 46.9 6 11. 1. 13.8 15.4 17.3 0.8 5.3 30.4 35.6 38.9 41.9 45.6 48.3 7 11.8 1.9 14.6 16. 18.1 1.7 6.3 31.5 36.7 40.1 43. 47.0 49.6 8 1.5 13.6 15.3 16.9 18.9.7 7.3 3.6 37.9 41.3 44.5 48.3 51.0 9 13.1 14.3 16.0 17.7 19.8 3.6 8.3 33.7 39.1 4.6 45.7 49.6 5.3 30 13.8 15.0 16.8 18.5 0.6 4.5 9.3 34.8 40.3 43.8 47.0 50.9 53.7
166 תרגילים: חברה אורזת סוכר במשקל עם סטיית תקן 51 גרם. משקל הסוכר באריזה מתפלג נורמאלית. החברה החליפה את מכונות האריזה במטרה לדייק יותר במשקל הנארז. )רוצים שסטיית התקן תהיה קטנה יותר(. לצורך בדיקה דגמו אריזות סוכר ולהלן משקלן בגרמים: 1117,1154,003,111,008 מה המסקנה ברמת מובהקות של %?.1 זמן ההחלמה ממחלה מסוימת כאשר משתמשים בטיפול מסוים מתפלג נורמלית עם סטיית תקן של היו:. 07,85,01,111,1 71 שעות. תרופה חדשה נוסתה על חולים. זמני ההחלמה שלהם בשעות א. ברמת מובהקות של % בדקו האם סטיית התקן של זמן החלמה של התרופה החדשה נמוכה מהתרופה המקורית. ב. האם ניתן לדעת מה תהיה התשובה לסעיף א אם נגדיל את רמת המובהקות? ג. האם ניתן לדעת מה תהיה התשובה לסעיף א אם נקטין את רמת המובהקות? ד. האם ניתן לדעת מה תהיה התשובה לסעיף א אם נוסיף תצפית שערכה? 81.5 הגובה של אוכלוסייה מסוימת נחשב כמתפלג נורמלית עם ממוצע של 184 ס"מ וסטיית תקן 15. במדגם של 51 אנשים מהאוכלוסייה התקבל ממוצע 181 וסטיית תקן מדגמית.50 א. בדקו ברמת מובהקות של % האם חל שינוי בשונות הגבהים באוכלוסייה. ב. בדקו ברמת מובהקות של % האם חל שינוי בתוחלת הגבהים באוכלוסייה בבחירת המבחן המתאים הסתמך על המסקנה מסעיף א'..0 H o : 4. השערות המחקר הן : H 1 : במדגם של 51 תצפיות התקבל סטיית תקן 1.140. תן הערכה למובהקות התוצאה.
167 פתרונות: שאלה 1 לא נדחה H o שאלה א. נדחה H o ב. לא תשתנה ג. לא ניתן לדעת ד. לא תשתנה שאלה 3 א. נדחה H o ב. לא נדחה H o שאלה 4 0 0.005 P v
168 1 0 H : 1 רקע: השערת האפס : השערה אלטרנטיבית: בדיקת השערות על שתי שונויות 1 0 H : 1 1 0 H : 1 1 1 H: 1 1 1 H: 1 X 1, X ~ N.5 1 1 H: 1 תנאים : 1.מדגמים בלתי תלויים נדחה את השערת האפס אם: F f ( n11, n1) Sˆ Sˆ 1 F 1 f n n ( 1, 11) F( n 1, n 1) אזי : 1 X F f או ( n11, n1) 1 F n n f ˆ F S S ˆ ( 1, 11) 1 N(, ) סטטיסטי המבחן : התפלגות F: X 1 אם ) N( 1, ו- התפלגות F הינה התפלגות אסימטרית חיובית התלויה בדרגות חופש של המונה ושל המכנה. 1 F ( n 1, n 1) n n 1 1 ( 1, 11) F כמו כן בהתפלגות F מתקיימת התכונה הבאה : df df n 1 1 1 n 1
169 דוגמה: )פתרון בהקלטה( מעוניינים להשוות בין נשים וגברים מבחינת השונות בזמנים שלהם לבצע משימה מסוימת. במדגם של 11 גברים התקבלו התוצאות הבאות לגבי זמני ביצוע המשימה: במדגם של 10 נשים התקבלו התוצאות הבאות: ( y y) 04 i ( x x) 00 i בדקו ברמת מובהקות של 5% האם קיים הבדל בין השונויות? מה יש להניח?
171